查看完整版本: [-- [讨论]疯狂的建议,我们合伙把《爱新觉罗宗谱》弄成可查询的文字版吧,只要能查出世系就好 --]

[稽古右文·康雍梦华] -> 竹园小憩 -> [讨论]疯狂的建议,我们合伙把《爱新觉罗宗谱》弄成可查询的文字版吧,只要能查出世系就好 [打印本页] 登录 -> 注册 -> 回复主题 -> 发表主题

ami886 2009-04-28 11:15

[讨论]疯狂的建议,我们合伙把《爱新觉罗宗谱》弄成可查询的文字版吧,只要能查出世系就好

现在做宗谱的软件很多,但都是要花钱的,唯一的破解版是家谱先生4.1绿色版,


可以查询,并追溯世系,统计人数,等等,缺点是,不能生成电子书版本,也就是,如果你要看宗谱,就必须装软件,才能打开。


 


我本来想用VB+EXCEL做个小程序来实现宗谱树状结构显示,但大学时学艺不精,结果惨不忍睹


再想到一个人把《爱新觉罗宗谱》录完。。好像太渺茫了


 


能不能分工合作,再以续谱的形式合并?


 


恩恩,我想这的确是个疯狂的建议


 


以下是一部分我已经录了的宗谱。


 



雪茜 2009-04-29 02:11

好像……我在另一个地方也看到了类似的帖子……


Orz~~


ami886 2009-04-29 02:40
恩,我在国学数典问过有没有好用的录入软件,但结果是。。扫面太模糊,根本没办法OCR,只有手工录入一条路

苇如 2009-04-29 05:32
这个有现成的了啊,截止1993年就已经有8万余宗人府的资料录入电脑了,李中清他们专门研究清朝皇室的家谱的。不知哪位大虾可以弄到这个资料。

toutou 2009-04-29 08:00
楼上的问你们家查先生要啊~~该同志自称不搞学术壁垒滴,嘿嘿

洗桐女史 2009-04-29 08:04

古籍OCR校对比较麻烦,但是各司其职的话,多找几个人就行。呵呵,偶毛遂自荐,在这方面,偶素很龟毛认真滴,以致于一一都怕我“阵亡”,嘿嘿~~不过这个人要少,就太艰巨了,而且自己费了九牛二虎之力,其他人看着等现成的旁观,心理也会有点小不平衡的,毕竟这种活实在不是人做的,所以要是没有分工,大家就都等现成的了,没人会出这个力的。


现在的问题主要是这个没有电子书,怎么办?那个不是小部头啊,难道楼主你要雇工去扫?楼主需要制定一个可行性的计划。


我建议楼主最好规定一条,就是扫描之后的文字版,只有参与扫描者才有权力得到全部的,如此才能吸引人去做,否则,就只能是一两个人的事,累死你,也做不完的。


这样有义务才有权利,这样才能实行的下去的!



多尔金 2009-04-29 08:05
以下是引用toutou在2009-4-29 上午 08:00:00的发言:
楼上的问你们家查先生要啊~~该同志自称不搞学术壁垒滴,嘿嘿

吼吼,好生猛的帖子,竟然逼着悠悠现身了!


洗桐女史 2009-04-29 08:12

呵呵,小淑女,查先生估计是没这个的资料的,他只是听说有这个资料吧。


还有,这个要参与的人多,其次也要保证质量,人名可不能随便找个相似的别字代替。



洗桐女史 2009-04-29 08:20
对了,那个国学数典做了一个明实录的电子搜索版,我也想自己做个其他的书的,可是不知道什么程序,谁能提供个好的?

苇如 2009-04-29 08:23
以下是引用toutou在2009-4-29 上午 08:00:00的发言:
楼上的问你们家查先生要啊~~该同志自称不搞学术壁垒滴,嘿嘿

呵呵,还是你问他要吧。


冬瓜 2009-04-29 10:30

这个提议很好!!!


 


 


苇如 2009-04-29 11:47

刚在国学数典下东西,发现楼主的ID了,还花了4个阿堵物下载了楼主上传的东西:)


洗桐女史 2009-04-30 03:34

这个要是扫的话,可能得找专门做这个的扫,上次听疾风兄说他雇人扫朱批,结果扫的都可不清楚了。但我觉得这根本不是扫描仪的事,而是咱们不可能像超星那样把书拆了扫。


反正这个工程很浩大,私人做难度很大。而且大多数人持观望的态度比较多。


 


洗桐女史 2009-04-30 03:42

这个电子版要是知道网络上的流源就好了,可以挖出来。超星是没扫这个东西,这个好像是从中美百万流出来的,可是其中有一册是中美百万也没有的啊,我有浙大的代理,可以上中美百万全库的,所以我估计浙大肯定不是最初流出资源的地方,要是能找出最初的出处,没准就能下到全套的电子版。


不过现在有些地方扫的电子版,不知道是否加密过了,或者图片本身有干扰码?我转成图片之后再OCR,居然一个字都没转出来。要是转出乱码来我倒不奇怪了。


 



巧克力八喜 2009-04-30 04:51
字库可以支持的话当然还是录入的好,毕竟生僻字并非多数,近支因有辈分有定字还算好查,远支的如果没有索引查起来就麻烦些了

蒲亭主人 2009-04-30 11:27

现在网络上能够找到的只有甲册和庚册,其他的6册没有啊,这是最大的问题。


 


如果我们真的要做电子版的话,那就把书文字生卒年,妻妾,爵位,宗谱上的履历,全部做成电子书吧,否则光有一个名字和世系,用处也不大啊。


洗桐女史 2009-05-01 10:11

那个档案还没有建成放出来过呢,有兴趣的可以看这篇文章:


“宗人府档案”电脑库的建立、分析利用及其困难


 ————————


人家那个好像有加州大学以及中央研究院的资助做的呢,结果还是耗费N年都没有完成。楼主不妨想一想艰巨性。实在不行的话,就做目录,以及生卒年等的索引就好了。



ami886 2009-05-01 11:11

网上现有的这个确实是太不清晰了,我OCR出来的全是乱码。


 


其实我只是想做一个目录,也就是只有名字和爵位,主要作用只是能检索出主要世系链,以便在查宗谱的时候容易查得到。


比如搜索努尔哈赤,出来的结果会是:“[1世]福满 → [2世]觉昌安 → [3世]塔克世 → [4世]努尔哈赤”,方便追溯而已。


 


然而现在最困难的问题是:


家谱先生4.1的版本里边,所有人物的数据是分单个文件存储的,这导致它永远不可能合并成一个文件。


而家谱6.1的版本在这方面做了改进,数据存储于同一个文件中,但目前却没有破解版,要注册就必须缴费。


软件作者现在正在努力让软件能生成独立电子档,以方便流通。对于我而言。


如果用家谱4.1做,意味着即使作者日后升级软件能生成电子档,我也没办法合成。


如果用家谱6.1做,一旦作者没研制出来,我录的东西就只能我一个人看-----想看的人都必须交钱买软件。


 


所以现在,我想只能搁浅等待了


ami886 2009-05-01 11:12

苇如MM说的是上传的那个可检索二十五史吧,我记得我特地找的免费区上传的呀,居然还要收阿堵物,太黑了!


ami886 2009-05-01 11:44

不知洗桐MM想做的可检索书籍是什么格式的,如果是文字版EXE的话,即使是最普通的eBook Edit Pro也是有搜索这项功能的


不过只能检索到关键字所在的这一章,具体段落还是需要CTRL+F一次才能确定的。


 


说到这里发现我在国学数典发的《二十五史全文检索》也不过就是一本带搜索功能的文字版EXE而已,


只要有文字内容,任何一个人都可以随便制作出来,却标上南开大学文学院研发的明头,真是汗。。。。


 


若是DJVU之类的格式的话,我倒在国学数典上见过一个教程,洗桐MM有兴趣的话不妨去看看


DJVU文件补做OCR文字层的教程(生成可以检索的DJVU)


http://bbs.gxsd.com.cn/viewthread.php?tid=155692&extra=page%3D1&frombbs=1


苇如 2009-05-02 01:07

对,就是那本可以检索的25史,被他们放到要收钱的地方下载了啊。


苇如 2009-05-02 03:01

呵呵,楼上早点来就可以省我四个阿堵物啦,不过,还是谢谢,可以方便其他人。不过可以搜索的,好像不是钱氏藏书,是一个三角形的,所有三角形出的,像《资治通鉴》,《续资治通鉴》,《十三经》什么的,都是可以检索的。


我原来的25史是一个正方形的版本,一检索就会断网,昏,是断网,CPU100%,把无线网络挤掉了。


还有不大喜欢TXT格式的,因为在电脑里看起来不舒服。


巧克力八喜 2009-05-02 06:29

应该也能搜索的,钱氏藏书,不过里面乱玛不少,而且搜索起来太慢,当然所有的表都缺


 


洗桐女史 2009-05-02 10:52

嗯,我是想做个类似于国学明实录那样的软件,很舒服的感觉。


eBook Edit Pro生成的是CHM格式的吧,不太喜欢。


另,那个所谓的8万多的宗人府档就是用EXCEL做的,咱们或许也可以这么做呢。


我先前本想用DZ自带的论坛程序做一个数据库,但是那个文字太多的话,就显现不出来,而且生僻字也不支持,郁闷的要死。


PS:苇如我的二十五史是TXT版的,放在手机上阅读的,呵呵。国学数典里TXT版的好像都是免费的哦


 



巧克力八喜 2009-05-02 11:32

是钱建文的25史吗?应该好找的吧


 


http://o2cj.qupan.com/exe/2008-9-11/10/www.qupan.com_2011651_二十五史.exe?51kohf55ntk5fcfn010tflag=1228962833opin=be369ed1f228b2ed8741ba1c2dbaa7d6.exe


 


这个不知道可以不


清史人 2009-05-06 12:14

支持!因为我很喜欢这方面的东西!


太液池 2011-06-16 12:21
不知道还有没有人对这个感兴趣,我觉得在线社区性质的网站最适合这个,而且我已经有一个框架了。等了好几个月也没有同好发现我,有点小灰心。。。

同样类型的网站也有不少,不过我觉得还是美国人做的这个最好,我们的(例如jiapu.com)还是差很多。网站本身的搜索并不理想,不过可以用google搜"人名+Geni"

燕书 2011-06-19 03:29
引用
引用第26楼太液池于2011-06-16 12:21发表的:
不知道还有没有人对这个感兴趣,我觉得在线社区性质的网站最适合这个,而且我已经有一个框架了。等了好几个月也没有同好发现我,有点小灰心。。。
同样类型的网站也有不少,不过我觉得还是美国人做的这个最好,我们的(例如jiapu.com)还是差很多。网站本身的搜索并不理想,不过可以用google搜"人名+Geni"

http://www.geni.com
這個網站好有意思哦。

太液池 2011-06-20 13:48
谢谢关注。其实我应该邀请诸位,这样大家就可以直接在我这个构架上添加了。怎么可以要到这里的高人的邮箱地址呢?

另外我想说,我已经“盗用”了这里的不少研究成果,又没有很好的注明出处,实在抱歉。


查看完整版本: [-- [讨论]疯狂的建议,我们合伙把《爱新觉罗宗谱》弄成可查询的文字版吧,只要能查出世系就好 --] [-- top --]


Copyight © 2005-2010 ourjg.com
Time 0.087869 second(s),query:2 Gzip enabled

You can contact us