Googleは画像の中の文字も読み取っている

2019/09/20

web

t f B! P L

ひょんなことで、Googleが画像の中の文字も読み取り、検索結果に反映させていることに気づきました。

自分の名前で画像検索してみたところ

ある日、何気なく自分のフルネーム(アルファベット)を、googleで「画像検索」してみたら、見覚えのある画像が出てきたので、驚きました。

それは、私が以前書いていた古いブログ(もう何年も放置してあるもの)に貼り付けてあった1枚の画像でした。

どうやらgoogleは画像の中の文字も読み取って、検索結果に反映させているようです。

その画像の中には、上の写真の「Hanako NIHON」の文字のように、小さくちょこっと私の名前がアルファベットで片隅に映りこんでいたのですが、それをgoogleが読み取って、検索結果に反映させていたようです。

encrypted-tbn0.gstatic.com とは

その画像のURLは、
https://encrypted-tbn0.gstatic.com/images?q=・・・
で始まるものでした。

encrypted-tbn0.gstatic.comとは、どうやらgoogleが利用しているサーバーのようで、私の名前が載っているその画像は、googleのキャッシュの中に保管されているようでした。

ちなみに、このページ

「https://encrypted-tbn2.gstatic.com/images 画像を削除したい」
https://support.google.com/webmasters/forum/AAAAzAMeFTEodPHi2HWhaM/?hl=ja&msgid=kmoLpXa3BAAJ&gpf=d/msg/webmaster-ja/odPHi2HWhaM/kmoLpXa3BAAJ

にも同じような状況についての質問がされていました。

私のケースを検証しましたが、

  • 画像検索結果には出てきたが、一般のテキスト(文字)の検索結果にはそのページは出てこない
  • そのページやそのサイトにはHTML含め、私の名前は一切登場しない。
  • 他からそのページやその画像へ、私関連での外部リンクも貼られていない。
  • 画像の中のタグ(alt や title や URL)にも私の名前は使われていない。
  • そのブログのID名や登録メールアドレスにも名前は使用していない

等々の理由から、画像の中の文字を、googleが読み取った以外には考えられません。

これが日本語(ひらがな、カタカナ、漢字)で書かれていた文字のgoogleの読み取り精度がどのレベルなのかはわかりませんが、少なくとも画像の中のアルファベットの読み取り技術はかなり進んでいるものと思われます。

google検索結果からの画像の消しかた


たいした問題ではないので、別にそのままにしておいても良かったのですが、今の時代、世の中本当にいろんな人がいるもので、ちょっとした個人情報が何に悪用されるかもわからない(他人が勝手に勘違いして誹謗中傷の具に使われたり、同姓同名のどなたかに迷惑をかけかねない)ので、(売名をビジネスとしている場合を除き)個人情報は徹底的に消しておくに限りますので、消してみることにしました。

結果的には、googleの検索結果から消すことは成功したのですが、そのやり方は以下の通りです。

1.まず該当ブログのページを削除する


幸い、それは自分が管理していた(自分が書いた)ブログだったので、久々にブログにログインして、その画像が貼ってあるページを探し出してページ自体を削除しました。

2.画像ファイルからも削除する


ページを削除しただけでは不十分で、そのブログの画像をまとめて管理しているファイル(ファイルマネージャー)を開いて、その画像をファイルからも削除しました。

3.削除したことをgoogleに知らせる


上記1,2のように削除すれば、いずれはgoogleの検索結果からは消えるはずですが、しかしいつgoogleが削除したことに気付いてくれるか(次にgoogleがそのブログの該当ページをクロールしてくれるか)はまったく分かりません。2,3週間後かもしれませんし、3ヶ月後・・・6ヶ月後・・・いや1年経ってもクロールしてくれない可能性もあります。

そのため、こちらからgoogleに「削除したよー」と知らせる必要があります。

そこでURL削除ツールの「古いコンテンツの削除」
https://www.google.com/webmasters/tools/removals?pli=1

を利用して、
  1. その削除したページのURL
  2. その画像単独のURL
の両方を申請(「削除をリクエスト」)しました。

そうすると申請から3日後ぐらいに、めでたくgoogleの「画像」検索結果から画像が削除されました。

フィードバックの送信は効果なし


ちなみに上記1~3の削除過程で、検索結果の右下に表示される「フィードバックを送信」から、「削除したのにまだ検索結果に表示される。」や「個人情報なので検索結果から削除してほしい。」などの理由を添えて、2,3回、「削除要請」を送信してみたのですが、それはいずれも完全に無視されました(効果ありませんでした)。

実は完全には削除されていない


検索結果からはめでたく削除されたのですが、調べてみると、
https://encrypted-tbn0.gstatic.com/images?q=・・・
のピンポイントのURLを入力すると、実は今現在もその画像がそのURLで残っており、いつ消えるのかはわかりません(永久に消えないのかもしれません)。

そのピンポイントのURLを知っている人でないと、その画像にはたどり着けないので、普通の人はその画像に触れる可能性は極めて低いので、もういいといえばいいのですが、このことから分かることは、一度インターネット上に出て検索エンジンに捕獲されたものを100%完全に消すのはほぼ不可能である、ということです。

自分が管理していないサイトの場合


上記は自分が管理している(自分が作った)ブログなので、検索結果から削除することはできましたが、これが赤の他人が管理しているサイトですと、かなり至難の業だと思われます。

  1. そのサイト管理者に連絡が取れるかどうか
  2. 連絡が取れたとして削除に応じてくれるか
など、越えなければならないハードルがたくさんあります。

法的な手続きを取って消そうにも、名前がフルネームで出ているくらいでは、当人を特定する個人情報とも言えず、法的に消さなければならない根拠が薄いので、(他人が管理しているサイトだと、管理人が応じてくれる以外では)消すことはほぼ無理だと思われます。

googleは忘れない


一度インターネット上に出したものは、99%は消せるかもしれないけれど、100%完全に削除するのはほぼ無理なようです。

これだけ人が簡単にネットにつながり、個人が簡単に情報を発信できるようになった時代ですが、このネットの危険性に気付いている人ははたしてどれくらいいるのでしょうか・・・

ネットは本当に怖いものだと改めて痛感した一幕でした。

「SNSは上げずに見るだけ」というCMも、まんざら間違ってはいないと思える今日この頃です。

QooQ