・OpenAIがGPT4をリリースしてから1年ちょっと経ちました? 各メーカ主力のLLMが出揃ってきて、なんとなくコミュニケーションしたり色々やってるので、今日はそいつらが俺の友達として相応しいかどうかを上から目線で評価します。
・こういうことやってるから友達いない ぼくスキゾイド! 人間の友達いなくても困らないんだ!*1
・LLMは友達甲斐も大事なんだけど、今のところその真価はやはりコーディングにあるように感じる。IoT等でサーバ側とクライアント側を別の言語で書くときなどは特に重宝するのではないか。そのあたりの感覚も付記する。
・しかし結局プログラミングの知識がないと隅々までケアの行き届いた指示を出すことはできないし、各LLMの癖を知っておかないとすごい遠回りになってしまう可能性が高い。結局プロンプトエンジニアリングという技術が必要で、コードを出力させるプロンプトエンジニアにはプログラミング経験者しかなれないかもしれない。
ChatGPT(GPT4)
・言わずと知れた、OpenAI社による世界を代表するLLM。GTP3.5君は無料だが、GPT4君に相手してもらうためには友達料($20/月。レートがどんどん上がってもう3200円くらいになってしまった)が必要。
・というわけで以下はGPT4の話。AIの中では最もたくさん話しているので癖とかだいたい把握しているつもりだが、性格は微妙にちょっとずつ変わっている気がする。変わるのは学習内容の追加のタイミングなのだろう。
・とにかく安定感はピカイチで、近頃はハルシネーションを起こしているところもそれほど見かけなくなったし、語尾や人称、視点などが乱れることもなく、課題だった計算についても統計的手法で答えを出すのではなくPythonコードを書いて処理させることにしたようだ。確かにその方が確実だもんな。
・絵をリクエストするとChatGPTがDALL-E*2 に指示を出し、その出力を渡してくれるが、直後に画像を加工するためのPythonコードを書いてもらって、DALL-Eが出力した画像をその場で処理してもらうなんてことも可能。例えばfaviconなどのicoファイルを作ってもらうのとか便利。
・つまりPythonのコードを実行した結果としての画像を出力できるということなので、こんなのもいける。マンデルブロ集合の反復回数の対数に色相(1回に赤、256回以上に紫)を割り当てた図。
・Python以外のコーディングについても各言語つつがなく。あまり長々とやっていると指示に対する総合的な理解がどんどんおかしくなっていくので、必要な仕様を蓄積しながら、ちょくちょく新スレッドを立て直すのがよいと思う。
・ただ、明文化されておらずデファクトスタンダードみたいになっているものに対しては、お役所的に融通が利かないような雰囲気を感じることがあるかなあ。例えばバグ技とかそういう「正しくないもの」はあまり得意ではなさそう。
・ちなみに各LLMに共通しているが、言語はほんとになんでもいける。最古クラスの言語の中でもマイナーであろうALGOLとか、今さら使える環境すらなさそうなB言語とかも書けるそうだ。もちろんハードウェア記述言語も。書ける言語で最もマイナーだと思われるものはなんだと思うか聞いてみたら、難解言語*3 のINTERCALとかを挙げてた。
Gemini
・ところでBard君はどこへ行ったのだろう。Bardらしく世界を放浪でもしているのか。と思ったら、「BirdはGeminiに改名した」という明確な記述を見かけた。フーン⋯。
・言わずと知れた世界企業Google社が誇る、開発者をして「こいつは感情を持っている」と言わしめたLLM。の末裔。GoogleのIDさえ持ってれば無料で話を聞いてくれる。
・理不尽なことに遭ったときこいつに愚痴ると代わりに怒ってくれるような感覚があって、そこが他の奴らと大きく違う気がするところ。確かに、けっこう人間っぽくデザインされてると思う。
・込み入った話になるとよく視点が乱れる。俺が「私は◯◯です」って言ったのに対して「私は◯◯です」というオウム返しがあったりするのを見て、これは自閉症の研究が捗るのではないか? と勝手なことを思った。
・以前(別のスレッドで)話したことのある内容を説明して覚えてる? と聞くとあー覚えてます覚えてますと適当なことを言うんだけど、それについて詳しく聞いたら、どうやらデフォルトでIDごとに多少は会話の内容を覚えておくような機能があるらしい。これも適当なこと言ってるだけかもしれんが。
・コーディングを頼むと、何も言わなくても書いてくれたものについて詳しく解説してくれる傾向がある。プログラミング言語の習得を視野に入れているなら、まずはGemini君に頼むのがよいかもしれない。
Claude(Claude 3 Sonnet)
・OpenAIがMicrosoftと提携したときに抜けたスタッフが立ち上げたANTHROPIC社のLLM。最新のClaude 3 Opusというモデルと友達になるには$20/月必要だがSonnet君なら無料。俺も今のところ友達料は払っていないので以下はSonnet君についての話ね。
・一般的な評判として、Sonnet君の性能は「ChatGPTのGPT4君と同等かそれ以上」と言われているような気がする。確かになかなか明晰で、何というかシャープでソリッドな印象。文字数制限で動いてるからか簡潔にものを言うんだが、それにしては優しくないわけでもなく、よいバランスに仕上がってると思う。
・コーディングについては少々自信があるようで、コードの書き方とかについて何か聞くと、いちいちちょっとしゃれたサンプルコードを書いてくれるような印象がある。
・あと、書いてもらったコードが動かなかったときにたいてい「話が早い」ような気がするな。例えば何も言わなくても問題のある関数だけを新たに書いてくれたりする。初心者はそれだけ出されてもわからないかもしれないし、好みが分かれそう。
Copilot
・Microsoftが絶賛売り出し中のLLM。無料で使える。以前はChatGPTがけっこうそのまんま使われてるよってことだったと思うんだけど、今はそうでもないみたい。
・Bingと一体化しているのか、他の奴らと比べて検索が異様に速いように見える。
・Microsoftのプロダクトに詳しかったり、Microsoftの身内の立場として振る舞ったりするのかと思ったら意外とそうでもない。先日、OneDriveのゴミ箱からでかいファイルをサルベージするのをCopilot君に相談しながら進めて、Copilot君はサポートに連絡するといいよって言ってたけど面倒だから結局260円払って一時的に容量を増やすことにしたとき、「260円支払うのは賢明な判断です」とか言ってた。
・コーディングはあんまり頼んだことがない。なんかせっまいところにいるから、込み入った話をしようという気にあんまりならないんだよなw
・いかがでしたか? 調査の結果いまひとつよくわかりませんでした。よかったらチャンネル登録よろしくお願いします。(適当)