关于作者

用户名:rainzen
笔名:rainzen
地区: 江苏-南京
行业:其他

日历  

快速登录

+ 用户名:
+ 密 码:

在线留言



网络资源

我的博克

访问统计:
文章个数:276
评论个数:1620
留言条数:33




Powered by BlogDriver 2.1

文章

总目录| a href="catalog_1.html" title="">图书馆学乱弹 | 信息组织 | 图书馆与社会 | 数字化图书馆 | 学术评价 |
转贴一则评论

冉先生又发表了一篇关于图书馆的文章,题目还是延续了老题目,观点也是老观点,水平不幸也是老水平。

冉先生一方面责备官方通过图书馆愚民,另一方面又责备图书馆服务不好,这不是自相矛盾吗?愚民这件事,图书馆其实是无能为力的,在整个愚民链中,图书馆其实处于末端,冉先生恐怕应该知道这个事实。愚民链中哪一链最重要?冉先生应该比我们更清楚。官方要愚民图书馆服务态度不好,不是抵消了官方的愚民?冉先生应该鼓掌才是,怎么反而指责有加呢?打个比方吧,奶粉有毒,经销商拼命推销,不是扩大了毒害面?反过来,经销商都是老弱病残,推销不力客观上不是减轻了毒奶粉的毒害?冉先生应该想明白吧?每次冉先生的宏论出来,总有许多愚民跟着瞎起哄骂图书馆,唯恐吃不到毒奶粉。冉先生,最好的公共图书馆服务不是在美国香港,而是在纳粹德国、苏联。朝鲜的公共图书馆服务也很好。尤其是纳粹德国的公共图书馆事业,可谓飞跃发展,详见Public Libraries in Nazi Germany, 作者:Margaret F. Stieg一书。为什么纳粹如此重视公共图书馆?因为此时的公共图书馆是纳粹宣传机器的一部分。

冉先生,如果没有表达的自由,没有信息的公开,公共图书馆是没有意义的,公共图书馆服务越好越不好,只有在民主自由的环境下,公共图书馆才有价值。冉先生明白?

冉先生又发表了一篇关于图书馆的文章,题目还是延续了老题目,观点也是老观点,水平不幸也是老水平。

冉先生一方面责备官方通过图书馆愚民,另一方面又责备图书馆服务不好,这不是自相矛盾吗?愚民这件事,图书馆其实是无能为力的,在整个愚民链中,图书馆其实处于末端,冉先生恐怕应该知道这个事实。愚民链中哪一链最重要?冉先生应该比我们更清楚。官方要愚民图书馆服务态度不好,不是抵消了官方的愚民?冉先生应该鼓掌才是,怎么反而指责有加呢?打个比方吧,奶粉有毒,经销商拼命推销,不是扩大了毒害面?反过来,经销商都是老弱病残,推销不力客观上不是减轻了毒奶粉的毒害?冉先生应该想明白吧?每次冉先生的宏论出来,总有许多愚民跟着瞎起哄骂图书馆,唯恐吃不到毒奶粉。冉先生,最好的公共图书馆服务不是在美国香港,而是在纳粹德国、苏联。朝鲜的公共图书馆服务也很好。尤其是纳粹德国的公共图书馆事业,可谓飞跃发展,详见Public Libraries in Nazi Germany, 作者:Margaret F. Stieg一书。为什么纳粹如此重视公共图书馆?因为此时的公共图书馆是纳粹宣传机器的一部分。

冉先生,如果没有表达的自由,没有信息的公开,公共图书馆是没有意义的,公共图书馆服务越好越不好,只有在民主自由的环境下,公共图书馆才有价值。冉先生明白?

- 作者: rainzen 2008年10月5日, 星期日 19:28  回复(0) |  引用(0) 加入博采

知识组织系统(KOS)心得(一)
  • 知识组织系统(KOS)描述框架

    知识组织系统是“各种用来组织信息和增进知识管理水平的方案的总和”,它包括各种词表、分类法等等传统信息组织技术,也包括了诸如语体网络、本体等现代信息和知识组织技术。(Hodge, 2000)

    知识组织系统可以看成是传统信息检索语言的发展,传统信息检索语言主要功能为标引者和检索者之间的信息沟通建立一个共同的表达语言。我们知道,一个信息检索系统得基本原理是将用户的提问和储存在系统中的文献进行匹配(match),并将符合用户提问的文献提取出来,为了实现用户提问内容和文献内容之间的匹配过程,人们必须为这两者建立一个共同的词汇,(Chowdhury, 2004) 这就是传统的信息检索语言。但是,随着网络时代的来临,信息管理更加依赖于信息技术,机器,如计算机系统越来越成为人们信息检索的工具,成为人们和信息资源沟通的桥梁,在某种程度上,信息检索是一个人机交互的过程,这就要求机器能够理解人的信息表法,无论是人的信息需求的表达还是人对信息资源描述的表达。这就催生了新的信息组织技术–知识组织系统(KOS)。

    和传统技术的本质区别在于,知识组织系统( KOS)是一种机器可理解的系统,也就是说,知识组织系统是可以被计算机系统所识别、读取和理解。它的核心在于构建概念(知识)属性的形式化描述框架以满足基于及其理解的信息处理和知识管理的功能需求并实现不同系统之间不同层面上的互操作。

    从现有的系统看,一个知识系统的形式化描述框架应该由四个层次组成:

  • 逻辑层(logic layer);
  • 结构层(structure layer);
  • 语义层(semantic layer)和
  • 句法层(syntax layer )。

    这四个层次担当不同的功能,逻辑层是机器理解和推理的基础;结构层是知识描述的基本框架;语义层用来实现语义标识,而句法层实现表达。

  • 知识系统的概念模型

    在上述四层结构框架中,结构层是一个知识组织系统的概念模型,这个概念模型描述了知识系统的基本特征并确定了知识处理原型。知识组织系统的结构层

  • 给出了知识单元的形式化定义;
  • 阐释了知识单元的基本形态、类型和值域;
  • 确定了知识单元的逻辑环境;
  •  规定了知识系统的基本运算规则。

    一般说来,具体的知识系统的概念模型是不尽相同的,它的模型构建取决于具体知识系统的功能需求,如分类法和叙词表的功能需求不尽相同,其概念模型就有很大的差异性。但是,无论具体的知识系统的功能需求有怎样的差别,他们总具有一定的共性,也就是说,知识系统总是有基本的普遍的功能需求。兰凯斯特总结了词汇控制的两个基本目标:描述的一致性和检索的完整性。(Lancaster, 1986)也可以被看成现代知识系统的基本功能需求。

    为了实现描述的一致性和检索的完整性,我们可以为知识系统建立一个普遍的知识结构原型,这个原型基于如4个假设:

  • 知识的基本单元是概念(Concept)及其相互逻辑关系(Relationship);
  • 每个概念具有明确的含义,可以用唯一的标识指示出来;
  • 概念可以通过一定的规则体系用确定的符号表达出来,所有用来确定表达一个概念的符号被称之为词(Term);概念之间的逻辑关系可以通过词间关系表达出来(Relations)。所以知识可以通过词及其关系表达出来;
  • 表达概念及其相互关系的规则体系和符号集被称为词汇(Vocabulary)。

以上4个基本假设是实现一个知识系统的必要条件。然而在现实世界中,一个概念可以有多种不同的表达形式,尤其当概念通过自然语言来表达时,概念的表达更是具有纷繁复杂的多样性。知识系统中的词(Term)和自然语言中的词(Words)之间不是一种一一对应的关系,而是一对多关系。知识系统就是通过建立Term和Words之间的对应关系,来实现表达的一致性,从而实现词汇控制(Vocabulary control)。

 参考文献:

Chowdhury, G. G. (2004). Introduction to modern information retrieval. (2nd ed.). London: Facet.

Hodge, G. (2000). Systems of Knowledge Organization for Digital Libraries : Beyond Traditional Authority Files. Retrieved September 25, 2008, from http://www.clir.org/pubs/reports/pub91/contents.html

Lancaster, F. W. (1986). Vocabulary control for information retrieval. (2nd ed.). Arlington, VA: Information Resources.

- 作者: rainzen 2008年09月29日, 星期一 17:49  回复(0) |  引用(0) 加入博采

支持万方、支持所有中国数据库和数字图书馆厂商!
读到图林老姜的博文得知又一家数据库供应商陷入了版权官司中,感慨万千。学者和数据库供应商本是同根生,相煎何太急?

学者是知识创造者,数据库出版商是知识传播者,两者是人类知识生产链上的两个紧扣的环节,应该是共生的关系而不是相斥的关系。学者创造知识是为了传播,不是放在家里自娱自乐给老婆孩子看的,数据库出版商免费帮你实现知识传播的理念,应该是皆大欢喜的事情,为何还要兵戎相见?学者和数据库出版商打官司,斯文扫地。

现在官司上门来了,躲也躲不掉,雨僧发此文,算是对万方的声援。万方不用怕!

  1. 从大方向看,数据库出版是趋势,如果中国数据库产业、数字图书馆产业跨了,中华民族又要落后一百年!我想宏观决策层必须考虑民族的未来,而不是几个学者刁民的蝇头小利。
  2. 学位论文的权益比较复杂,从国际惯例看,不是作者单方拥有学位论文的全部权益,授予学校和导师都享有权益,比如,学位论文不经学校和导师同意,不能擅自发表。如果万方从学校方获得授权,应该不构成侵权,如果说侵权的话,学校方才是侵权方。学者要告就告学校,告万方没有道理。
  3. 万方的学位数据库应该向精品方向发展,不要是学位论文就收录,搞的鱼龙混杂,图书馆用户都不愿买。应该建立学位论文收录推荐评审制度,确保收录的学问论文是能够代表中国学位水平的。可以和国家各种奖学金、奖励基金挂钩,将自己纳入国家学术评价机制中去,这样确保学位数据库的权威性和代表性。使得一篇学位论文被收录是件光荣的事情,在求职和评职称时,能够书上一笔。只有这样,这些博士硕士才会求爹爹拜奶奶请你收录他们的论文,还打什么官司?万方和其他数据库厂商要有这个底气!

支持万方、支持所有中国数据库和数字图书馆厂商!

- 作者: rainzen 2008年09月17日, 星期三 10:30  回复(1) |  引用(0) 加入博采

MARC21對多語言的處理模式
 (

       MARC21提供了兩種處理多語言編目數據的模式,模式A和模式 B

 模式A 

   模式A被稱作本國語言和音譯(Vernacular and transliteration )模式,是比較常用的一種處理模式。在這個模式裏,本國語言和音譯被放在不同的固定字段裏,一般採用880字段來處理一條編目記錄中同時出現本國語言和音譯。根據880字段的定義,它是用來存放Alternate Graphic Representation,那么像中日韩这样的Graphic 文字,就应该放在880字段里。MARC21建议,如果一条记录里同时有本国语言和音译,最好使用模式A。可能是西方國家比較習慣羅馬文字的緣故吧。880字段本身可以放這種信息,其語義是通過$6這樣一個連接字段,和非880字段連接起來,通過這個連接來指示特定880字段的語義。如880  $6 245-01這樣就和提名責任者項聯係起來,這個880字段就是用Graphic文字描述的題名和責任者。如果880  $6 300-02 就是物理形態描述項。英美國傢的書目數據庫主要用模式A來描述非羅馬文字的樹木信息的。對於中文數據而言,漢字信息也是放在880字段的。模式A其實不是很合理,880字段的語義是不清晰的,如果套用DC抽象模型的一對一原則,880顯然是不符合的,它的語義其實是由值來表達的,這位計算機處理帶來一定的麻煩,從而導致在處理非羅馬文字信息時不很順當。

 

 

模式B 

 

    模式B被稱作簡單多語言紀錄(Simple Multiscript Records)。在這個模式裏,任何語言都可以放在規定的字段,而不是像模式A那樣,將非羅馬字符放在880字段。B模式不使用880字段。正因爲任何語言都可以放在規定字段中,B模式就不再對字段的可重復性做出規定,也就是說,B模式中任何字段都是可重復的。例如一本中文書以B模式著錄的話,可以有2個或多個245字段。對於採用非羅馬字符的語言,如中日韓俄阿拉伯語等,B模式更簡單,邏輯上似乎更通順。無論用什麽語言,題名總是題名,元數據格式必須保持語義的一致性,不能因爲語言的不同而人爲造成予以的模糊。所以,B模式為多語言編目數據提供了一個更爲清晰的語義描述結構。至於字段重復,原先MARC是用來交換卡片目錄數據,並一磁帶格式儲存,限制字段可重復性主要是受到這兩個因素的制約。現在這兩個制約因素已經不復存在,或者說已經不是決定性因素,對字段可重復性的限制應該更加開放了。將來MARC完全轉到XML旗下,字段的可重復性限制應該不復存在了。

 

該文的實例發表在雨僧的個人網站:http://libtec.rainzen.info上

雨僧的個人域名:libtec.rainzen.info 將存檔一些技術性文章,歡迎大家大駕光臨。

 

- 作者: rainzen 2008年09月10日, 星期三 06:20  回复(0) |  引用(0) 加入博采

致铁冰

铁冰先生在图林荣获特别贡献奖,心满意足,走了。铁冰先生也应该走了,奥运就要结束了,图林或许有时间反击了,这样下去,会爆发一场世纪大战的。K师及时发出最具思想性最具文采最具智慧的停战告示,成功地避免了一场两败俱伤的大战。图林的和谐是头等大事,不能轻易破坏了。

铁冰兄是圈外人,不要轻易介入图林事务,以前一位冉云飞的作家侵入图林,图林也把他培养成图书馆学家,铁冰兄难道也想成为图书馆学家不成?老僧其实也非图林人士,侵入图林最后落得个“流氓”称号,足见图林这潭子水是趟不得的。

和铁冰兄争论时一件愉快的事情,(继续蹈地颂之)对于雨僧来说是一次很好的思想体操,其间最有趣的是关于科学定理的讨论,铁冰兄至今还未说服我,当时雨僧忙于系统的可用性测评,讨论科学哲学这类自己不熟悉的问题太费脑筋,所以挂了个免战牌,留待以后再向铁冰兄请教。

和铁冰兄的论战同时也帮助雨僧重新思考图书馆学研究的价值,铁冰兄的一个留言让雨僧彻底开窍,技术救图的图,已经不是原来的图书馆了。这是一张很薄的纸,让铁冰兄捅破了。雨僧一直对信息组织和信息基础结构(information infrastructure)有浓厚的兴趣,也一直想把图书馆纳入II中思考,相信只有将图书馆纳入新的II,图书馆才会有希望。铁冰兄的这个留言提醒了雨僧,如果将图书馆纳入新的II,图书馆就不是原来的图书馆了,那么,我们为什么还要背负老图书馆这个包袱?铁冰兄帮我解了这个结,请铁冰兄接受雨僧的谢拜。

雨僧是个老图书馆员,思维已经陷入了深深的图书馆怪圈,只有和铁冰这样的圈外人争论,才会有新的收获,这才是争论的乐趣、思考的乐趣。

论战结束了,老僧虽然落了个流氓称号,但还是满载而归,铁冰兄也应该回到他的植物病理学中去了,让我们就此握手言别,希望下次有机会再战。

临别前雨僧有两件事想作一解释:用户永远错误论是一个戏言,和用户永远正确论一样不能成为学术研究的原点。我更喜欢表述为“用户中心原则”。用户永远正确和错误这样的判断,其最不科学之处不在其逻辑,而在“永远”两字,科学研究理论会下“永远”这个绝对化的判断吗?

第二件事是关于争论的言语,在争论中铁冰兄用了很多非中性词语,影响了争论的客观性,铁冰兄可能以为这无关紧要,但真的学术讨论,语气也是很重要的。在西方学术文章中,一般常用This paper argue三 这样的语气讨论文问,而不会用“无知”这样的语气。年轻人喜欢绝对,这是一种不成熟的表现,真心希望铁冰兄成熟起来,你是个才华横溢的人,偏激会让你的才华打折扣的。当然,雨僧在争论中用词也很激烈,这里向铁冰兄和其他读过雨僧博文的人说声抱歉。

最后祝铁冰兄在植物病理研究方面做出更大成就,早日获诺贝尔奖。

- 作者: rainzen 2008年08月24日, 星期日 05:07  回复(0) |  引用(0) 加入博采

Farewell, 铁冰

经我等小二“蹈地颂之”,铁冰欣欣然,乃去。奥运快结束了,铁冰大战风车也告一段落。我等店小二也可弹冠睡个好觉了。感谢铁冰兄和我们一起渡过了看奥运同欢乐这段美好时光。图情兄最后说,铁冰永远是正确的,这也是雨僧的看法。伟大光荣正确的铁冰,再见!

- 作者: rainzen 2008年08月23日, 星期六 16:41  回复(0) |  引用(0) 加入博采