新闻资讯
看你所看,想你所想

杰拉德·索尔顿

杰拉德·索尔顿(1927年3月8日,纽伦堡--1995年8月28日),出生于德国纽伦堡,毕业于哈佛大学。他被认为是现代搜索技术之父,也是现代信息检索的奠基人,著品区跑掌今一新鸡议名的IR向量空间模型的创始人,开发了著名的SMART向量空间模型IR系统并免费开放源代码下载,大来自大促进了IR的发展。太根海姆基金会会员,美国科学促进会会员,美国计算机协会情报检索专门小组。

  • 中文名称 杰拉德·索尔顿
  • 外文名称 Gerard Salton
  • 国籍 美国
  • 出生日期 1927年3月8日
  • 逝世日期 1995年8月28日

人物经历

  1927年3月8日生于德国纽伦堡。1950年大学毕业,1952来自年获硕士学位,1958年在美国哈佛大学数学系获哲学博士学位。

  1958~1965年任哈佛大学应用数学助理教授。

  1965年在康乃尔大学计算机科学系任教授,1971~1977 年任该系系主任。

  1966~1968年来联致齐要任《美国计算机协会通讯》主编,1969~197360百科2年任《美国计算机协会杂板组编苏统雨苦皇织任光志》主编,《信息系统》、《美国计算机协会计算调查》、《美国计算机数据库系统汇刊》编辑。

主要成就

  第一个真正意义上的搜索引擎于20世纪60年代创建,发明者是Gerard Salton。他和他的团队在度良标项康奈尔大学创造了"智能信息检索系统"(SMART information retrieval system),SMART代表Salton's Ma续供陆列跑求代定天它gic Automatic Retrie染草察里识万普ver of Text(Salton的神奇文本自动检索器)。

  Gerard Salton被认为是现代搜索技术之父。他的著作《A Theor刘卫高y Of Indexing关别脱》、《Term Frequency-Inverse Document Frequency》为搜索引擎提供了理论的基础。

  1983年度首届Salton奖得主,Salton就是以他名字命名。他是现代信息检索的奠基人,著名的IR向量空间模型的创始人,开发了著名的SMART向量空间模型IR系统并免优固汽重派立费开放源代码下载,大大促进了IR的发展。生前供职于美国康奈尔大学计算机系。没换急帝出未该有主页,只有一个纪念网页维基上介绍其他光荣事迹包括:康内尔大学计算充而机系(共同)创始人,在派素CS领域最顶尖的两份刊我春述被团主物"communications of ACM" 和" journal of ACM"都当过主编,每三年一次旨在奖励对IR有突出贡献的萨尔顿奖以他的名字命名。

  多年来,索尔顿在自动化情报检索的教学和研究工作中取得了很大成就。1961年主持建立了落免景失型置践原世界上第一个全自动文本处理和检索的实验性系统 SMART,该系统扩展了H.P.卢恩以计算机处理自然语言文本为基础的标引和检索概念。他在情报检索理论模型、检索策略和系统评价、自动标引和分类等方面都有重大建树。他对图书馆学也有一定研究,在培养人才方面作出了贡献。索尔顿发表了许多关于情报学、情报检索、情报处理和语言处理等方面的论著,主要有:《电子数据处理》、《计算机在商业上的应化祖意鱼用》、《数学语言学》、《情随念力略七报检索理论》《自动情报组织与检索》《SMART 检索系统──自动文献处理实验》、动态情报与图书馆处理和《现代情报检索导论》等。由于他在情报检索方面作出了重大贡献,他的名字被收入《美国名人录》。

  Gerard Sa国苏互lton (8 March 1927 in Nuremberg - 28 August 1995) was a Professor of Computer Science at Co此电合模阿rnell University. Salton was perhaps the leading computer scientist working in the field of information retrieval during his time. His group at Cornell developed the SMART Information Retrieval System.

  Salton was born Gerhard Anton Sahlmann on March 8, 1927 in Nuremberg, Germa互六费ny. He received a Bachelor's (1950) and Master's (1952) degree in mathematics from Brooklyn College, and a Ph.D. from Harvard in 1958, the last of Howard Aiken's doctoral students, and taught there until 1965, when he joined Cornell University and co-founded its department of Computer Science. He was editor-in-chief of the Communications of the ACM and the Journal of the ACM, and chaired SIGIR.

  Salton was an ACM Fellow (elected 1995), received an Award of Merit from the American Society for Information Science (1989), and was the first recipient of the SIGIR Award for outstanding contributions to study of information retrieval (1983) -- now called the Gerard Salton Award.

Smart系统

  Gerard Salton是现代搜索技术之父。他在哈佛和康奈尔大团队开发出了SMART信息恢复系统。Salton's Magic Automatic Retriever of Text包含了来自类似向量空间模型、逆文档频率(IDF),术语频率(TF),术语偏离值(term discrimination values)等概念和相关反馈机制。

  Smart系统是最著名的、使用者最多的实验系统之360百科一。其原因一方面是它的历史比较长,另一方面是它的使用是免费的,且可下载源代码,使研究者使用起热误来非常方便。Smart系统由美国康奈尔大学研发,最初的研发工作由Ger家哥置菜ard Salton教授领导,并在20世纪80年代初开发出第一个版本。其维护工作由Chris Buckley负责,最新的版本是Smart11。

  开发Smart系统的目的是为了给文本信息检索艺子补次脸系并促证思技术的研究者提供一个完善的实验平台。在这一灯松木层电掌神首身手庆思想指导下,Smart实现了一个完整的基于向量空间模型的文本信息检索系统,不过当前只能处理英文文档。利用Smart,用户可以对一组文档建立索引,然后交某即可对给出的问询(query)返回检索结果,并对结果进行评价。

  同时,它包括去除stopwords(stopwords列表可由用户指定)、去除词形变化(stemming)、weighting计算等子功能模块。用户可以根据自己的需要分别调用。不过,由于其设计题坏海越色乐般心材矛原年代较早,Smart系统存在一个很大的缺点,即只能处理大约500MB以下的文档黑主转坚集合,这使它在数据量达到10GB以上的TREC Web Track这样的问题时显皇乐称采织切类得力不从心。Smart系统的另一个不足之处是缺乏良好的文档,使用者己具解自径阻作并极十乙常常需要自己摸索使用方内言历唱齐值着举例福法。

转载请注明出处安可林文章网 » 杰拉德·索尔顿

相关推荐

    声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:fendou3451@163.com