12345678 保存成:
12/1234/12345678 这样结构
每个文件都很小,可能只有几k。 但是数量非常巨大。请问用哪种方式比较好?
1. 好像确实和python无关,不过也许大家对这个话题更感兴趣
2. 确实,或许在数据库里更好,不过这里的情况是,如果使用 web server 直接提供查询结果的静态文件,而不走后端的应用服务器查询的话,似乎性能最快。
3. 巨大的数量级,我希望是过亿
>> 12345678 保存成:
>> 12/1234/12345678 这样结构
LDAP ?
>>
>> 每个文件都很小,可能只有几k。 但是数量非常巨大。请问用哪种方式比较好?
>
> 把架构师干掉。这个是数据库的需求不是FS的需求。
>
> - --
> Xin LI <del...@delphij.net> http://www.delphij.net/
--
http://zoomquiet.org'''
过程改进乃是催生可促生靠谱的人的组织!
PE keeps evolving organizations which promoting people be good!'''
比如 gdbm 的 key = value, key 算 file name , value 放 file content.
Hash 作 index 又是单个文件, 不影响 file system.
可以改一下 gdbm 里限制 gdbm 或者 ndbm 的 value 最多只能 4k 好像...
2008/9/18 eSX <nay...@gmail.com>:
只说查询性能的话,
1. 将 bsddb 或 qdbm 放在裸设备上,
2. 将单独文件放在文件系统(或用两级 hash 目录),
哪个更快呢?
Linux 对象存储文件系统的研究
http://www.ibm.com/developerworks/cn/linux/l-ofs/
???
--
http://zoomquiet.org'''
过程改进乃是催生可促生靠谱的人的组织!
PE keeps evolving organizations which promoting people be good!'''
[HR]金山软件常年招聘大量Py/C++人才!
https://groups.google.com/group/python-cn/web/ot-py-c
简历直投俺就好;-)