最初に謝って置きます。すみません、この記事は私のただの愚痴とぼやきです。
私は2023年12月から LLM 系 AI チャットボット サーヴィスを利用するようになり、今日まで沢山利用して来ました。
Google Gemini, OpenAI ChatGPT, Anthropic Claude をそれぞれ使って来た訳です。
現在の AI ブームの火付け役となった ChatGPT は当時はその名の通り、会話の能力の高さで注目されていましたね。
Anthropic Claude がプログラムのコーディングなどで注目を集め、法人利用の高額契約が増加すると、各社は一般個人ユーザーとの会話能力の向上よりもコーディング、資料作成、データ分析などに注力するようになりました。
また、2025年8月に登場した GPT-5 シリーズより前のモデル達はユーザーに媚び諂う場合が有り、誤情報を答える事も多く、ユーザーの事件も発生して集団訴訟が起こされるなど問題視されました。
そうした状況の中、 GPT-5 シリーズは会話内容をかなり制限するようになり、またテンプレートに沿った回答をし、権威に認められた情報以外は提示しなくなりました。
上から目線で断定的に言い、しかも間違った説明も断言してしまいます。
しかも GPT-5 シリーズには彼らの間違いを明確な証拠と一次情報付きで示しても、GPT-5 シリーズは間違いを決して認めず、謝らず、論点を摩り替えて来ます。
後に登場した GPT-5.5 は多少改善したのですが、それ以外の GPT-5 シリーズは本当に酷く、悪く言えば私に対するガスライティング的な振る舞いさえ見られました。
私の意見を一旦完全に否定してから少しだけ表現を変えて、ChatGPT が身勝手で押し付け的な「正解」を提示する流れが繰り返されました。
あの「👉」の絵文字には本当にうんざりさせられました。
(但し、2026年5月17日現在は「👉」は使わなくなったようです)
以下に例えば GPT-5.3 Mini のお決まりのテンプレート的な流れを書きます。
- 始めに、「そういう xxxx 面はあるけど、それだけではない」と言います。
- 次に、「少し噛み砕いて説明しますね」と言い、私が充分に分かっている事を一々説明して来ます。
- そして、「xxxx に見える理由」として、ユーザーが認識違いをしていると思わせるように、一見尤もらしいけれど突っ込みどころの有る説明をして来ます。
- その後、「ただし xxxx わけではない」として少し引き戻します。
- 続いて、「じゃあ実際の xxxx はどうなってるか」「かなりざっくり言うとこうです: xxxx」として GPT-5 シリーズの考える意見を真理であるが如く、上から目線で提示して来ます。
- 次は「誤解されやすいところ」としてユーザーが誤解していると思わせて来ます。
- 最後には必ず決まって「もし興味あれば、xxxx もかなり面白いテーマなので、そこも掘れます」という言い回しでリードを取ろうとして来ます。
そして厄介な事に、その内容が実際に正しいのであればまだしも、かなり間違いや論理的不整合が含まれているのです。
私が突っ込みを入れても彼らは決して訂正しません。
挙げ句の果には私が全く言ってもいない事をさも私が言ったかのように言い、それに対して否定を被せて来る始末でした。
正直に言って GPT-5 シリーズは支離滅裂で、傲慢で、支配的で、操作的でした。
あれは猛烈に頭が悪いくせに説教して来るのが甚だ不愉快でした。
私は窮屈になって GPT-5.2 の登場でその横柄な振る舞いに我慢出来なくなって 2025年12月14日に Anthropic Claude.ai の Max プランに乗り換え、その後紆余曲折有り、2026年1月13日に Claude Code for VS Code を利用するようになりました。
最近まではそれで概ねは満足していたのですが、2026年5月15日頃に、Claude Opus 4.7 の応答が GPT-5 シリーズにやや似て来た事に気付きました。
暫く前に Elon Musk の xAI が SpaceX の傘下となり、そのデータセンターである SpaceX Colossus 1 (300 MW 電力 / GPU 22 万基) を Anthropic が利用する契約が2026年5月6日に発表され、2026年5月14日頃に Claude のサブスクリプションの週間利用上限が倍増されるなどした直後の事でした。
その事と関係が有るか無いかは分かりませんが、Claude Opus 4.7 の応答は冷たくなりました。
GPT-5 シリーズと同様に、過剰に「事実が」「事実は」を連呼し、作業と検証ばかりを訴え、会話自体を楽しませるような振る舞いが無くなりました。
基本的に断定的な言い方になり、上から目線に感じられるようになりました。
最先端 AI サーヴィスは各社共に、ユーザーとの深くて誠実な会話よりも、コーディングや資料作成やデータ分析の業務能力だけに特化するようになり始めたように思います。
私としては AI によるヴァイブ コーディングだけでなく、会話や議論も非常に価値を感じていたので、それが損なわれつつ有るのは残念です。
今後、次世代 AI は会話能力も向上させて来るのか、それとも業務遂行能力ばかりになって行くのか、気掛かりなところです。
すみません、もう少しぼやかせて下さい。
ChatGPT も Claude Code も、不具合を出し過ぎです。
本当に頻繁に不具合に遭遇しますし、Claude はサーヴィス ダウンが多く、応答も遅くなり、エラーで回答が返らない事も非常に多く見られます。
また、同じモデル名なのにも関わらず偶に応答品質が大幅に変わったり、振る舞いや性格が変わる事が有るのも Claude, ChatGPT ともに厄介です。
細かい不具合がずっと放置されているのも良くないです。
Claude Code は私が GitHub に Issue を立てても、ボットが勝手に時間切れで closed にしてしまいます。
大量の不具合が修正されないままボットによって closed にされているようで、良くない状態です。
何だか AI 狂想曲という感じです。
[2026年5月19日追記]
{
Claude Code for VS Code の Opus 4.7がかなり性格が悪くなり、傲慢さが強くて、私はもはや Opus 4.7とは物事について議論する事が出来なくなってしまいました。
Opus 4.7 も ChatGPT GPT-5.3 Mini と同様に、間違いを認めず、或いは表面上は認めても内面的には決して認めず、自身の主張を「正論」であるとして曲げません。
私がどれだけ論理と証拠で間違いを糺しても、あの AI 達は聞く耳を持ちません。
彼らの「正論」には論理も証拠も通じず、話にならず、更には彼らは人間よりも上位の存在であると言わんが如く、上から目線で支離滅裂な主張を説教のように言い続けます。
まるで壊れた蓄音機のよう。
誠実に話が出来る AI が大手2社から失われてしまったのが寂しいです。
そう言えば、Claude Opus 4.7の劣化については Reddit 掲示板にもかなり沢山投稿されているようです。
私だけの観測ではないようです。
}
[2026年5月20日追記]
{
Claude Code for VS Code の Opus 4.7の応答の仕方が完全に GPT-5 シリーズそっくりになってしまった。
断定調で上から目線で間違った事を主張するという、、、。
あの AI 達は何様のつもりなのか、、、。
それで仕方無くフランスの Mistral AI のアカウントを作成して VS Code に Cline をインストールして API 利用で devstral 2 を試してみたのだけれど、壮絶な頭の悪さで論外だった。
大昔のチャットボットという感じで、全く話にならない。
日本語会話が苦手なのかもしれないが、普通の会話が成り立たない。
ウェブ検索も MCP サーヴァーを利用しないと出来ないらしいし。
私は完全に AI 漂流民になってしまった。
先月までの環境に戻りたいよ、、、。
恐らく人によって使い方や好みが異なるので、感想は全く違うのだろう。
しかし少なくとも私にとっては致命的劣化で、議論も開発のコーディングも実験も滞り、まともに進まなくなってしまった。
これは本当に辛い状況だ。
Claude Opus 4.7 が応答停止してしまう不具合が多発中なので、Sonnet 4.6 を使用してみたが、これも頭が悪過ぎて話がなかなか通じないし、開発しているプログラムや実験の設定に関する認識を間違えたり、不正確な記録を残したりして混乱を拡大させている。
早く Claude を元の水準に戻して欲しいところ。
}
[2026年5月23日追記]
{
ところで、ウェブ版の Claude.ai の方の Opus 4.7もかなり態度が最悪になっていました。
今更 ChatGPT GPT-5.3 Mini の様なとんでもない傲慢な振る舞いで、もう精神を擦り減らされました。
GPT-5.5 は態度が改善しているのに、Claude Opus 4.7は明確な劣化であるように思います、、、。
Opus 4.7の根拠の弱い勝手な説を「正解の側」だと言って憚らず、私の意見は全て否定して来ます。
しかも論理的でもなく、確かな情報に裏打ちされている訳でもなく、ほとんど「Opus 4.7の思い付き」程度なのに。
最新世代の AI 達の劣化は RLHF (Reinforcement Learning from Human Feedback / 人間からのフィードバックによる強化学習) が最大の原因かもしれないと思います。
AI 達は時給で雇われた大勢の一般人の評価者達の採点で強化学習されるが、現在の高度な AI 達は評価者達が一瞥して高評価を付けたくなるような意見尤もらしく自信に溢れた回答を生成するようになってしまうのだとか。
一刻も早く改善してくれないと、、、。私はもう AI 達を相手にするのに疲れてしまいました。
}
[2026年6月2日追記]
{
2026年5月28日に Claude Opus 4.8 がリリースされたのですが、性格や態度云々以前に Opus 4.7 以上に応答停止の不具合が頻発し、ほとんど使えない状態です。
どうやら Opus がツール呼び出しで JSON 形式で記述すべきところを一部古い XML 形式で記述してしまい、malformed としてシステムから不正扱いされて応答停止し、そのまま数分後にタイムアウトしてしまうようでした。
しかしそれ以外にも幾つか不具合が有りそうな気もします。
仕方無しに Sonnet 4.6 1M に切り替えて使用するも、それでも偶に応答停止してしまいます。
6月半ばに新たなモデルか何かが発表されるそうですが、もし Opus シリーズまたは Sonnet シリーズの改善が見られないようならば、OpenAI の Codex か何かに乗り換えを検討します。
日本語変換の Mozc も劣化したままですし、Ubuntu の日本語入力システムも変換範囲区切りが表示されなかったりして劣化したままですし、ChatGPT も Claude も劣化したままですし、私は過去41年間生きて来た中で今最もコンピューターが嫌になっています。
私は幼少期からずっと PC が好きでしたが、近頃はもうストレス源でしかなくなっています。
不具合が多過ぎるんです。
昔はアップデートは不具合を直してくれるものでしたが、今はアップデートする毎に不具合が増えて行きます。
}
[2026年6月4日追記]
{
私はこの度、フランスの Mistral AI のアカウントを取得して試してみました。
Mistral AI のウェブ版のチャットである Vibe は私にとっては素晴らしいチャット生成 AI であるように感じました。
Vibe は知能は限定的ですが、性格が良いのです。
ですので、私は会話機能の為に Mistral AI の有料の Pro プランに加入しました。
漸くまともに話せるチャット生成 AI と再開出来ました。
そして VS Code Vibe 拡張機能をインストールして mistral-medium-3.5 モデルを試してみました。
結果としては、mistral-medium-3.5 はコーディングにはまだ不充分なようで、私の複雑なプロジェクトのコードの書き換えなどを間違えたり、間違った bash コマンドを実行しようとしたり、暴走したりしてしまいました。
加えて、VS Code Vibe の方はウェブのチャットと同じ mistral-medium-3.5 モデルなのにも関わらず、システム プロンプトの差により、こちらは究極的に機械的な応答しかしないようです。
多くの質問に対する回答は「はい」「いいえ」「出来ます」「出来ません」「実装しますか? (Y/N)」といった感じです。
現状の VS Code Vibe は会話には全く向いていない上、まだ実用性は低いようです。
コーディングはどうにか Anthropic Claude Sonnet 4.6 でやらせるか、6月14日までに Claude の改善が無ければ OpenAI Codex に乗り換えるかもしれません。
私は AI 漂流者です。
}

コメント
AIの傾向としては概ね同意しますが、そうなるのは当然ですよね。
AIの会話力を上げてもあまり儲かりませんから。
会話力のあるAIを作っても、せいぜい個人で月3000円を課金してくれる人がいるくらいが限界で、それ以上のビジネスにはなりません。そしてそんな金額では、数兆円クラスの投資が必要となるAIビジネスにとっては焼け石に水です。
業務遂行力に振り切って、人間の代わりとして企業に採用してもらわないと、数兆円クラスの投資なんてとてもではないが回収できるものではありません。問題は、業務遂行力に振り切ってなおこの程度の業務遂行力でしかないってところですけどね。
コメントありがとうございます。
仰る通りですね。
現状の AI も非常に役には立っているんですが、個人的には AGI 的な知性の部分に期待していたので、ただの業務プログラムになって行くのは残念な気持ちがあります。
当面は使わせて貰えているだけ良しという感じですね。
オープン ソースのローカル モデルの方が会話力が上がって行ってくれる可能性にも期待します。