No.340


【Google Drive】OCRを利用する

アップロードするだけでOCR機能が利用可能

 意外と知られていないのだが、Google Drive に画像やPDFファイルとアップロードすると、自動的にOCR機能が働いてテキストデータを作成してくれる。

Googleドライブヘルプ PDFや写真のファイルをテキストに変換する

 この機能の実装は古く、2010/6には実装されていたようだ。しかし、知っている人間はかなり少ないようだ。かくいう自分もこの間ようやく気がついた。

 綺麗なデータの性能は良いようだが、自分が試した縦横混在など特殊な書類には弱いように思える。

 しかし、無料で一定制度のOCRを動かしてくれるのは比較資料としてもありがたい。積極的に利用していきたいものだ。


手順

 Google Drive にアップロードして開くだけ。

  1. Google Drive に対象ファイルをアップロードする。
  2. 右クリックして「アプリで開く」を選ぶ。
  3. 「Googleドキュメント」を選ぶ。

 これでGoogleドキュメント作成時にOCR機能が働いてテキストデータが作成される。

 主な注意事項としては以下がある。

  • 形式 jpeg、png、gif、pdfのみ対応。
  • ファイルサイズ 2MB以下。

 なお、ファイルサイズに関しては2MBを超えていても変換されていた。負荷を考えてそのくらいにしたいということなのだろうか。