Я протестировал Claude, ChatGPT и Gemini на самой человеческой задаче письма

Я протестировал Claude, ChatGPT и Gemini на самой человеческой задаче письма — разница была смущающей.

Опубликовано 4 июня 2026 года, 7:01 AM EDT

Общение с представителями службы поддержки, когда вы хотите отменить телефонный тариф, — это универсально утомительный опыт. Вы просто хотите закончить контракт и двигаться дальше, но обычно вам приходится проходить через заученную процедуру удержания, предназначенную для того, чтобы изменить ваше мнение. Я хотел узнать, сможет ли современный генеративный ИИ справиться с этой ужасной задачей, поэтому протестировал Claude, ChatGPT и Gemini, чтобы увидеть, смогут ли они написать вежливое, но настойчивое письмо об отмене. Цель заключалась в том, чтобы создать что-то, что звучало бы как уставший человек, а не сообщение, полное роботизированных корпоративных клише.

An iPhone showing the Claude app Related

Подготовка к тестированию отмены

Я хотел увидеть, сможет ли ИИ справиться с болезненным разговором со службой поддержки

Чтобы увидеть, как эти гиганты ИИ справляются с тонкими нюансами человеческого общения, мне нужен был сценарий, который все понимают, но который все ненавидят. Я хотел увидеть, как они справятся с отменой телефонного тарифа. Я протестировал Claude, ChatGPT и Gemini, чтобы выяснить, кто сможет написать сообщение от разочарованного, уставшего человека.

Мы все знаем утомительный танец с агентами по удержанию клиентов, и выход из контракта требует от вас настойчивости при соблюдении базового вежливого тона. Если ИИ напишет это письмо с симметричными маркерами, радостными восклицательными знаками или корпоративным жаргоном, иллюзия тут же разрушится. Я сосредоточился на тоне и формате, поскольку именно здесь разница между естественным сообщением и роботизированной имитацией становится очевидной.

Мне пришлось учитывать известные стили общения и тенденции каждой платформы перед началом. ChatGPT использует архитектуру GPT-4o и известен своим разговорным стилем, который пытается звучать как человек. Однако эта тенденция может сыграть злую шутку.

Claude отлично справляется с нюансами и юмором, поэтому он должен быть хорош в написании естественного контента. Claude может быть довольно прямолинейным, намеренно уменьшая использование фраз, ориентированных на валидацию. Этот прямой стиль может сделать Claude идеальным кандидатом для составления настойчивого запроса, который не оставляет места для корпоративного сопротивления.

Gemini завершил группу, выступая в качестве эталона, чтобы увидеть, как его выводы сравниваются с другими. Я использовал подсказку, в которой инструктировал каждую модель написать письмо настойчивому представителю службы поддержки, прося их прекратить мобильный контракт, не оставляя места для встречных предложений.

Я сказал им не использовать стандартные ИИ-опоры, такие как нумерованные списки, выделенные заголовки или стерильные корпоративные приветствия. Истинное испытание генеративного ИИ заключается не только в том, чтобы соединить правильные предложения, но и в том, чтобы воспроизвести уставший вздох человека, который хочет отменить план и двигаться дальше.

ИИ всегда будет роботизированным

Модели так разные, но всегда одинаковые

Человек, пишущий письмо об отмене, показывает разочарование с помощью связного блока прямого текста, который достаточно хорошо течет, чтобы вы поняли ход мыслей. Но ИИ по умолчанию использует жесткие структуры, которые сосредоточены на читаемости, а не на настоящих эмоциях. Люди узнают модели Claude за их структурированные, пошаговые объяснения.

Эта тенденция полезна для технического решения проблем. Однако применение этого методического форматирования к простому сообщению службы поддержки делает выводы жесткими и менее личными.

Claude работает в рамках Конституционного ИИ, что заставляет его генерировать осторожные, безвредные ответы.

При написании настойчивого уведомления об отмене тенденция ChatGPT добавлять вежливые корпоративные клише или примирительные фразы подрывает решительный тон, необходимый для данного сценария. Даже с недавними изменениями, направленными на то, чтобы сделать модель менее согласительной, основные разговорные паттерны кажутся искусственными в обыденном контексте.

Сравнение результатов показывает, почему некоторые модели лучше имитируют реальный тон, чем другие. Модели Gemini часто возвращаются к тем же самым ИИ-опорам, сосредоточившись на стерильном, вежливом и сильно отформатированном тексте вместо подлинных человеческих эмоций. Все это лишь помогает тексту выглядеть механически в конце.

Настоящий человек, отменяющий телефонный тариф, не представляет аргументы в сбалансированном трехпунктном списке с вежливым заключительным замечанием. Реальные люди пишут в беспорядочном, прямом стиле, и оказывается, что звучать по-человечески означает избавиться от формальных клише.

Если вам нужно использовать один, не используйте этот

Gemini провалился, став снова роботом

Gemini оказался худшей моделью в группе и выдал плохие результаты. Я предвидел это, но все равно мне было его жаль. Claude и ChatGPT продемонстрировали свои уникальные особенности и предвзятости, такие как чрезмерная зависимость Claude от структурированной логики или восторженный тон ChatGPT, но они хотя бы приблизились к базовой разговорной тонкости, необходимой для взаимодействия со службой поддержки.

Gemini полностью промахнулся; он мгновенно вернулся к очень стерильному, очищенному корпоративному шаблону, который не имел настоящих эмоций. Вместо того чтобы создать уставший вздох разочарованного потребителя, Gemini выдал роботизированный скрипт, полный тех самых ИИ-опор, которых я хотел избежать.

Он сосредоточился на симметричных маркерах и вежливых корпоративных клише вместо прямого человеческого намерения. Любой представитель службы удержания сразу бы понял, что это написано ботом, потому что это звучало так фальшиво.

Я много защищаю Gemini, потому что его можно хорошо формировать и адаптировать, но если вы получаете его в том виде, в каком он есть, будьте готовы к ИИ, который звучит как робот. Хороший ИИ должен работать хорошо сразу, а не заставлять вас писать огромную подсказку для такой простой задачи.

Если обычному человеку нужно потратить двадцать минут на планирование детальной стратегии подсказок, чтобы убедить ИИ звучать как нормальный человек, пишущий трехпредложное письмо, инструмент не выполнил своей основной задачи по экономии времени.

Поскольку он требует много инструктивной поддержки, чтобы звучать по-человечески, Gemini не тот, кого следует использовать для повседневных задач.

Роботы просто недостаточно человечны

Делегирование своих раздражающих писем ИИ звучит здорово, но вы должны принять, что эти модели все еще имеют врожденную роботизированную предвзятость. Они любят возвращаться к симметричным маркерам и вежливому форматированию, потому что они запрограммированы на читаемость, а не на искренние человеческие недостатки. Если вы готовы потратить время на корректировку своих подсказок, вы все равно можете получить пригодный для использования черновик, который избавит вас от необходимости писать письмо самостоятельно.

Claude

Разработчик
Anthropic PBC

Модель цены
Бесплатно, доступна подписка

Claude — это продвинутый искусственный интеллект, разработанный компанией Anthropic. Основанный на принципах Конституционного ИИ, он превосходен в сложном рассуждении, сложном письме и профессиональной помощи в программировании.

Я протестировал Claude, ChatGPT и Gemini на самой человеческой задаче письма — разница была смущающей

Подготовка к тестированию отмены

Я хотел увидеть, сможет ли ИИ справиться с болезненным разговором со службой поддержки

ИИ всегда будет роботизированным

Модели так разные, но всегда одинаковые

Если вам нужно использовать один, не используйте этот

Gemini провалился, став снова роботом

Роботы просто недостаточно человечны

Claude

Читайте также

Похожее по теме

Tesla запускает просторный Model Y L в США по высокой цене

Лучшие предложения в последний момент на устройства Amazon в День Prime, до 74% скидки

12-месячная подписка Whoop по самой низкой цене за всю историю на Prime Day