第18章 网站联盟和友情链接(第2页)
林世琛在网宜的个人网站上挂上了东宫网的内容,并专门追踪网络站上的最新更新,进行转载。
原创方面则把链接直接指向了东宫网。
期间,刘教授对东宫网提供了大力支持。
为了充实更多的内容,刘教授找来了在项目中空置的一台扫描仪。
这种扫描仪不仅可以扫描中文,而且也可以扫描日文、英语等。
在当时的单台售价达到了50万人民币。
这类仪器采用ocr技术,主要应用领域是在医疗领域。
ocr{opticalcharacterreition}光学字符识别,意思是利用光学技术对文字和字符进行扫描识别,并将其转化为计算机内码。最初概念诞生于1929年,由德国的科学家首先提出,并且申请了专利。几年后,美国科学家也提出了对文字进行识别的想法,但这种梦想直到计算机诞生后才变成为现实。
最先投入汉字识别研究的rb东芝公司,于1983年发布了其识别印刷体日文汉字的ocr系统-ocr-v595,其识别速度为每秒70~100个汉字,最高识别率达到99.5%。
清华大学率先推出了国内第一套中文ocr软件--清华文通th-ocr1.0版,至此中文ocr正式从实验室走向了市场。
清华ocr印刷体汉字识别软件其后又推出了th-ocr92高性能实用简/繁体、多字体、多功能印刷汉字识别系统,使印刷体汉字识别技术又取得重大进展。到1994年推出的th-ocr94高性能汉英混排印刷文本识别系统,则被专家鉴定为“是国内外首次推出的汉英混排印刷文本识别系统,总体上居国际领先水平”。
上个世纪90年代中后期,清华大学电子工程系提出并进行了汉字识别综合研究,使汉字识别技术在印刷体文本、联机手写汉字识别、脱机手写汉字识别和脱机手写数字符号识别等领域全面地取得了重要成果。具有代表性的成果是th-ocr97综合集成汉字识别系统,它可以完成多文种{汉、英、日}印刷文本、联机手写汉字、脱机手写汉字和手写数字的识别输入。