LLMs.txtはまだ早いんじゃないかという話

掲載日
更新日

はじめに

社内で「AI検索のためにLLMs.txt対応した方がいい」という話が出てきたので、少なくともLLMs.txtに対応するのはまだ時期尚早のように思うよというポエムです。

まだ提案段階

いくつかの記事は「LLMs対策はもうWeb標準」のように書いているので、弊社の社員も勘違いしてしまったと思うのですが、そもそもこの仕様はまだ提案段階で、Web標準仕様ではありません
(元ネタのサイトProposalになってます。)

「そのうち標準になる可能性はあるんじゃないの」という方もいると思います、もちろんその通りです。
でも自分は以下の理由で難しいと思います。

  • 「ユーザーがクローラーに何かを伝える形式は過去悪用された」という問題。
    昔々SEO対策時代、悪質なサイトはmetaタグにページの内容に関係のないあらゆるキーワードを詰め込みました…。
    LLMs.txtでも同じような悪用が起こるのではないでしょうか。
    Google社員のジョン・ミュラー氏がLLMs.txtに対して否定的なニュアンスなのもそういう苦い経験を当事者として経ているからだと思います。
    (参考サイトのジョン・ミュラー氏の以下の発言に全文同意です。)

「サイトは本当に、LLMs.txtに書かれたとおりのものなのだろうか?」――確認すればわかることだ。であれば、最初からサイトを直接チェックすればいいのではないだろうか?

  • Google社員はやや否定的な姿勢、OpenAIやMSも声明なしで関与もしていません。
    もちろん大手が参加すればいいというものではないです。(自社有利な仕様入れてくるのが常です。)
    ただ、現状Googleの上記発言は十分納得のいくものですし、無視して進められるものでもないと思ってます。

個人的見解

Googleのジョン・ミュラー氏はこれまでも、度々小手先のテクニックよりコンテンツの中身を重視するような発言をしています。

AIであってもそこは変わらないと思います。そうすると結局上記の発言に倣って、「最初からサイトを直接チェックしても良いものにすればいいのではないか。」となるのではないかなと思います。

なお、

At the moment the most widely and easily understood format for language models is Markdown. 

LLMs.txtのGitHubから引用

ということなので、マークダウンで情報を記述することでAIの理解を多少助ける効果はありそうです。
とはいえ、HTMLも当然解析できるはずで、その精度もこれから向上していくでしょう。
DOM構造を適切に整え、何よりも高品質なコンテンツ(内容)を作成することの方が、AI検索においても重要なんじゃないかと思います。

参考

記事の作成者のA.W.のアイコン

この記事を書いた人

A.W.
茨城県在住Webエンジニアです。 PHPなどを業務で使用しています。 趣味ではGoやNuxt、Flutterをやってます。

Comment