画像の中のテキストの抽出(OCR化)はGoogleドライブ→ドキュメントがベスト

ルーキーくん
画像の中からテキストデータを抽出したいのですが、簡単にできて精度の高いツールはありますか?

今回はこんなお悩みを解決していきます

この記事の内容
・Googleドライブ → Googleドキュメントを使った画像のテキスト化(OCR)の方法

こんな人が書いています

exp

Macユーザー歴20年超のめんどくさがりインハウスデザイナー。
Macでも無料で使えるスプレッドシートの使い方
無料で使えるアプリなどを紹介


先輩さん
おいおいおい!文章を画像から手入力って大丈夫?手打ちミスんなよ。え?これテキストないの?
ルーキーくん
はい。ないんですよ〜!コピペもできないし。。。しょうがないので手打ちで。
デザインさん
それにしちゃ文字多くね?これ大丈夫?
ルーキーくん
いや〜、大丈夫じゃないっすね。あ、やべミスった。
デザインさん
おい!ちゃんとチェックしてくれよ。
ルーキーくん
先輩、なんか画像から文字を抜けるような方法知りません?先輩けっこうグレーなテク詳しいじゃないっすか?
デザインさん
おい!
いや、あるけどさ。。。
ルーキーくん
え?あるんですか?
デザインさん
あるって。とりあえずグレーなテクの件はひとこと謝れ。
ルーキーくん
はーい、すんません〜!
デザインさん
(コイツ・・・)

まずは、こちらのinstagramの動画をご覧ください。使用しているデータは違いますが今回行っている方法を使って画像からテキストを抜き出す方法や結果を紹介しています。

今回は、文字をコピーできない画像やページの中のテキストから文字を抽出できるようにする方法を紹介します。このような画像からテキスト化(OCR)をするなら、Googleドライブ → GoogleドキュメントでのOCR機能がベスト!というエントリーです。

コピーのできないページからのテキスト化は画像の中から文字をテキスト化するのと同等の手順になるので、画像のテキスト化の手順から方法を見ていきます

Googleドライブ→ドキュメントを使った画像のテキスト化の手順

Googleドライブ→ドキュメントを使った画像のテキスト化の手順

それでは、実際に画像のテキスト化を実践していきましょう。

1.テキスト化したい画像を用意します。

2. ドライブの中にドラッグ&ドロップします。

3.ドライブ内に格納されたら、選択して「 Ctrl+クリック 」、アプリで開く→からGoogleドキュメントを選択

4.上に画像が、下にテキストが配置されたGoogleドキュメントデータが開かれます。

上部分、画像が配置
下部分、テキストデータ化

あとはこのデータからテキストをコピーして使えばいいだけ。めちゃくちゃ簡単です。

実際にOCR化してみる

それでは、先ほどテキスト化した結果をもっと詳しく見てみます。

今回のデータはpinterestから元のページへ遷移して、そこにあったPDFデータをダウンロードして画像に書き出したデータからOCRを行っているのでかなり画質は良い状態でテキスト化ができています。(ピ1654 × 2339pixel)

実際のデータ

この画像を認識したテキストがコチラ↓。

OCR化したテキスト
札幌市若年層職場定着支援事業 若手社員が育ち、長く活躍できる! 企業の 人材力UB 活用 参加 1セミナー 無料 | 若手社員 お仕事力アップセミナー 30 定員各回 対象者 40歳以上の方は、入社3年以内であっても対象外です。 – 第1回 1.18金 13:30 15:30 – – – 第2回 1.21月 13:30 15:30 第4回 2.14% 13:30 15:30 – – 第3回 13:30~15:30 – 130-15:30] – – – – 特定社会保険労務士越騰恵子氏 – – – – – アンガーマネジメントコンサルタントTM 岡本真なみ氏 | テーマ若手社員の未来をひらく!心の筋トレ(島情コントロール) 上司や先輩との良好な関係を作るために、怒りの感情を理解し、コントロールす る手法や周囲や上司への伝え方(アンガーマネジメント)を学び、職場内コミュニ ケーションの強化と自立型人材の育成を目指します。 – – テーマ | 相手に届く伝え方のコツ~仕事をスムーズに進めるために~ 「伝える(話す)とは何か」という基本から始まり、「ロジカル(合理的)に考えるコ ツ」、さらに「相手の立場に立った話の組み立て方」について学びます。これによ り、日々の業務に不可欠な思考力、問題解決力、伝法力を強化します。 – – – – 「若手社員 人材力活用セミナー 300 定員各回 30人 対象者 – – – 対象者、中小企業に所属する人事・人材育成担当者及び管理者 第1回 1.30(水) 13:30 15:30 第2回 2.13水) 13:30 15:30 [講師] 株式会社リンククリエイト代表 山崎敏史氏 本問社会保険労務士事務所代表本間あづみ氏 テーマ人が定着し採れる組織づくりを | テーマ若者が定着する労務管理と働き方改革 – – – 講師 – – – – – – – – 時代の劇的な変化と常版の変化をしみ、ターゲット(若年)の理解と対応から、 世代間の違いの受容、「人事理念」からの定着力・採用力の向上を失敗例と成功 例を通して、人が定着する組織づくりを学びます。 若者の現状、長時間労働のリスクや働き方を変える5つのステップ、中小企業取 「組事例や、有休の義務化、時間外労働上限規制など働き方改革法への対策、ダイ バーシティインクルージョンの取組事例など、労務管理について学びます。 – – — イススキノ 駅前通 JR札MR 会場 北海道新聞1階 道新プラザDO-BOX(札幌市中央区大通西3丁目6) 地下街オーロラタウン「郵便局・北海道新聞社」出口、「北大通西3・北海道新聞社」出口より徒歩1分 北海道新聞 大通公園 参加要件 参加後に職場定着に関するアンケートのご協力をお願いします。 ●若手社員/3年程度(計3回) ●人事・人材育成担当者及び管理者(1回) ■1回の実施につき1社あたりの参加者数は2人までとさせていただきます。 時計台 札橋市役所 お問合せ 札幌市若年房職場定港支援事業事務局 TEL:011-210-6025(土・日、祝日を除く9:30~17:30) 実施・運営 / 北海道新聞社 営業局主催 / 札幌市 SAPP_RO さっぽろ店 02-H03-18-1089 30-41220

小さい文字までしっかりとテキスト化されています。かなりの精度の高さ。これはありがたい!

デザインさん
画像の解像度によっては読み取りの精度が落ちることはありますが、いい感じに使えます

まとめ

今回はGoogleドライブ→GoogleドキュメントのOCR機能で画像をテキスト化する方法をご紹介しました。

簡単な上に精度も高いのでかなり使えます。しかもGoogleのツールで無料で使用できるところもありがたいですね

とても便利なのでぜひ、ご活用ください。

それでは、今回はこのへんで。

ABOUTこの記事をかいた人

現場のグラフィックデザイナーに有用なリアルな技術やスキルアップの方法などを発信しています。 デザイン制作会社に8年→現在は都内にある日用品メーカーのグラフィック系インハウスデザイナーとして7年(総デザイナー歴15年)。そのかたわらフリーでデザインをしています。ラクにできるところはラクに!という時短デザインを推奨しています