《古籍馆数据库》资源依托全国各类图书馆,整个项目预计收录1949年以前30多万种(不同版本)古籍文献资料(约合8千多万张图片),大约录入50亿字。分期分批推进完成。《古籍馆数据库》的建设参考中国图书馆十二五规划建设目标,建设一个全面反映中国古代文献流传与存藏状况的大型文献典籍资源总库,实现一站式全文检索。
《古籍馆数据库》一期收录6万种古籍书,6.3亿字。其中:经部(11400种)、史部(27500种)、子部(6200种)、集部(13700种)。
古籍馆全文检索平台採用超速文本检索引擎并配合分佈式服务器集群,亿级文字检索只需1秒。系统配合UNICODE编码和大字符集,能显示和检索7万多个汉字(win xp操作系统需安装大字符集)。基本做到书中字字可检。
迅搜(xunsearch)是采用 C/C++ 基于 xapian 和 scws 开发的全文搜索引擎解...
阅读量: 626 2024-10-12