[请益] 如何加快软件工作程式搜寻效率

楼主: FacetheFaith (Yes Man)   2017-09-20 16:12:23
借助软件版的高人气,请教一下前辈们,小弟有一支搜寻Google Drive的程式
因为使用者通常不知道folder id,所以默认的搜寻位置是从根目录(root)开始搜寻档案
我采用的是深度优先搜寻法(DFS),也就是搜寻到的档案如果是资料夹
那么接着就开始搜寻该资料夹下的档案,以此类推
如果要搜寻的档案在很前面 (不清楚一开始搜寻的资料夹是依据什么),
那么该档案就很有可能被找到
反之,就有可能回传 HTTP 500 Internal Server Error(应该是Time out)
程式码如下,是使用递回搜寻:
... 省略 ...
service = new Drive.Builder(httpTransport, JSON_FACTORY, credential)
.setApplicationName(APPLICATION_NAME).build();
System.out.println("=== Start to search ===");
long startTime = System.currentTimeMillis();
File searchResult = recursiveSearch(folderID, searchFileName);
if (searchResult != null) {
result = searchResult.getName();
// 结束时间
long endTime = System.currentTimeMillis();
long totTime = (endTime - startTime) / 1000;
// 印出花费时间
System.out.println("花费时间:" + totTime + "秒");
}
public File recursiveSearch(String folderID, String searchFileName) throws
IOException {
File searchResult = null;
FileList fileList = service.files().list()
.setQ("'" + folderID + "' in parents and trashed = false")
// .setSpaces("drive")
.setCorpora("user")
.setFields("nextPageToken, files(id, name, mimeType)").execute();
List<File> items = fileList.getFiles();
System.out.println("files size is " + items.size());
for (File file : items) {
if (file.getName().equals(searchFileName)) {
searchResult = file;
System.out.println(file.getName() + " is found!");
return searchResult;
} else if (file.getMimeType().equals("application/vnd.google-apps
.folder"))
{
System.out.println("recursive search");
System.out.println("file.getId() is " + file.getId());
searchResult = recursiveSearch(file.getId(), searchFileName);
} else {
System.out.println("file name is " + file.getName());
}
if (searchResult != null) {
System.out.println("Finish");
break;
}
}
return searchResult;
}
public static void main(String[] args) throws IOException {
DriveSearch driveSearch = new DriveSearch();
String result = driveSearch.fetchData("hfjBV5Z3V2c", "test.txt");
System.out.println(result);
}
在Google Drive上面的根目录搜寻同样档案一下子就找到了,
所以是算法的问题吗?
程式该怎么改写才能增进搜寻效率?
谢谢!
作者: StarRoad (知道越多了解越少)   2017-09-20 16:15:00
这里是"软件工作"版,不是软件版
作者: JameC (智取其乳)   2017-09-20 16:22:00
你可以去Prob_Solve 问问看那里虽然冷清,但通常都会有人回答你
作者: sing10407 (阿U)   2017-09-20 16:34:00
stackoverflow上应该比较容易有解答
作者: drajan (EasoN)   2017-09-20 16:37:00
建index 每一小时更新一次那个index table就好
作者: alog (A肉哥)   2017-09-20 16:51:00
1. 需要建立跟维护档案的索引表,搜寻时可以优先找索引里的资料2. 索引表里面可以根据一些特征,帮他标上一些 Meta 例如:属于图片类、文件类,再根据搜寻的关键字特征优先寻找特定类的资料概念大概就是这样 剩下的你得自己去想 毕竟是维护你自己app
楼主: FacetheFaith (Yes Man)   2017-09-20 18:17:00
用elasticsearch建立index效果好吗
作者: pttuser (pttuser)   2017-09-20 18:29:00
你可以重写
作者: PUTOUCHANG (自己的废文自己发)   2017-09-20 18:42:00
你会自删吗?
作者: chuegou (chuegou)   2017-09-20 18:53:00
楼上好问题
作者: ChungLi5566 (中坜56哥)   2017-09-20 19:03:00
我猜25号前就删了
作者: blackcan (太平李荣浩)   2017-09-20 19:20:00
有种手机拍电脑画面的感觉…请用gist
作者: zerof (猫橘毛发呆雕像)   2017-09-20 19:33:00
作者: alog (A肉哥)   2017-09-20 19:33:00
1. 如果你的服务下需要用到这样,用 elasticsearch 可啊,不过要说,这东西是索引系统如果真的挂了你就当作不能恢复,直接重新建立 2. 你可以先用 docker 把软件拉下来运作进行评估 3. 记得搜寻条件记得下好,不要让其他 user 可以存取到他人的索引 这台也只能挂在后端不能对外存取
作者: pttworld (批踢踢世界)   2017-09-20 20:18:00
我在解题版回你了
作者: bakedgrass (蒙古烤小草)   2017-09-21 02:52:00
因为高人气所以当作问题板不是好风气
作者: iamshiao (CircleHsiao)   2017-09-21 10:29:00
贴 SO 问
作者: THEWORLDS (天下)   2017-09-22 15:11:00
GOOGLE的我写过 他会动态改变每一次地址真的很难抓

Links booklink

Contact Us: admin [ a t ] ucptt.com