5ちゃんねる ★スマホ版★ ■掲示板に戻る■ 全部 1- 最新50  

■ このスレッドは過去ログ倉庫に格納されています

OCRを使ってますか?

205 :名無しさん@そうだ選挙にいこう:2006/06/13(火) 22:59:41
他のスレでも書きましたが、平凡社世界大百科事典をOCRにかけています。
1冊500〜600ページx32冊をe.typistでtxtデータ化していますが、何だかんだで
スタートしてから1年くらい経過しました。
今現在、32冊中の28冊分のOCRが終了しました。今月中には完了するでしょうが
さすがに疲れました。
識字率については正確さはあきらめて、吐き出されたテキストをperlで修正しています。
とりあえずタイトルさえ正確に出来ていれば本来の百科事典的な使い方が出来るので
本文検索とか多くは望まないようにしています。

68 KB
■ このスレッドは過去ログ倉庫に格納されています

★スマホ版★ 掲示板に戻る 全部 前100 次100 最新50

read.cgi ver 05.04.00 2017/10/04 Walang Kapalit ★
FOX ★ DSO(Dynamic Shared Object)