No.340
【Google Drive】OCRを利用する
アップロードするだけでOCR機能が利用可能
意外と知られていないのだが、Google Drive に画像やPDFファイルとアップロードすると、自動的にOCR機能が働いてテキストデータを作成してくれる。
Googleドライブヘルプ PDFや写真のファイルをテキストに変換する
この機能の実装は古く、2010/6には実装されていたようだ。しかし、知っている人間はかなり少ないようだ。かくいう自分もこの間ようやく気がついた。
綺麗なデータの性能は良いようだが、自分が試した縦横混在など特殊な書類には弱いように思える。
しかし、無料で一定制度のOCRを動かしてくれるのは比較資料としてもありがたい。積極的に利用していきたいものだ。
手順
Google Drive にアップロードして開くだけ。
- Google Drive に対象ファイルをアップロードする。
- 右クリックして「アプリで開く」を選ぶ。
- 「Googleドキュメント」を選ぶ。
これでGoogleドキュメント作成時にOCR機能が働いてテキストデータが作成される。
主な注意事項としては以下がある。
- 形式 jpeg、png、gif、pdfのみ対応。
- ファイルサイズ 2MB以下。
なお、ファイルサイズに関しては2MBを超えていても変換されていた。負荷を考えてそのくらいにしたいということなのだろうか。