Как ChatGPT «Понедельник» учит тайваньский китайский? Все прочитал PTT, Dcard, Дзюбака.

Question

Модуль стиля ChatGPT «Понедельник» выбалтывает множество тайваньских фраз и идиом, потому что он «захватывает» много материала из тайваньской сети. (Синопсис: ChatGPT запустил уставший от мира женский голос «Понедельник», ленивый и потерянный в сообществе, чтобы стать популярным) (Справочное дополнение: Бюро ИС официально ответило на «ChatGPT — это большое количество подражаний Ghibli»: имитация ИИ не является незаконной, в зависимости от случая) Когда вы откроете голосовой модуль в стиле ChatGPT «Понедельник», вы обнаружите, что «этот парень немного зябкий и устал от мира», и обнаружите ваш акцент, и в ответ заговорит на «тайваньском мандаринском», почему это звучит так похоже на тайваньский? Ответ: ChatGPT признал, что собирает много данных в тайваньской паутине. Что такое "Режим понедельника"? Мы должны уточнить, что "Monday" - это не новая GPT-модель и не модернизированная версия GPT-5, а стиль диалогов, сделанный OpenAI с настройкой стиля на архитектуре GPT-4. Проще говоря, один и тот же ИИ меняет свой тон, например, надевает разные комплекты одежды, ходит на работу и в выходные. Режим понедельника расслабленный, немного прохладный, вежливый, но не многословный, и такое ощущение, что вы только что зарегистрировались в компании в понедельник, и вы очень меланхоличны. Краулер с большим количеством тайваньских данных обучает OpenAI для обучения GPT, что на самом деле очень «олдскульно», но очень эффективно: увидеть, как вся сеть взорвалась. В том числе новостные сайты, Википедия, китайские книги, социальные форумы, блоги, PDF-файлы, черные истории, которые вы писали на безымянных сайтах. До тех пор, пока это публичная веб-страница, те, кого могут просканировать поисковые роботы, скорее всего, будут брошены в корпус для обучения. Мы сравнили поведенческие реакции основных корпусов с открытым исходным кодом и GPT и обнаружили, что эти тайваньские СМИ были прочитаны ChatGPT: «United News Network», «ETtoday», «Zhongshi Electronic News», «Wind Media», «NOWnews»... У этих СМИ есть одна общая черта: здесь нет заблокированного платного доступа, поиска в Google, а структура сайта чистая и легкая для подъема. И наоборот, такие сайты, как Tianxia, The Report и BusinessWeek, которые оплачиваются или блокируются стенами членства, имеют очень низкие шансы на обучение. GPT действительно читал произведения тайваньских писателей GPT очень хорошо имитирует ритм романных диалогов в стиле девяти ножей, а также может рассказывать сентиментальные предложения в стиле У Няньчжэня, и даже тон «Великой реки и моря» Лун Интая. Что это значит? Он действительно прочитал или, по крайней мере, увидел репост клипа. Скорее всего, эти работы были сильно скопированы и вставлены на PTT, блогах или сайтах репостов контента, а ранние работы Nine Knives даже публиковались непосредственно на раскадровках PTT, а затем фиксировались моделями в качестве учебных материалов. Если вы спросите его о деталях романа Чжан Дачуня или Ло Ицзюня? GPT обычно начинает нести чушь, потому что литературные произведения редко обсуждаются и цитируются, нет публичных электронных файлов, они напрямую не перепечатываются в интернете, а если и есть, то их невозможно поймать. PTT - тайваньский учитель чувств GPT Это почти наверняка: GPT понимает терьера деревенских жителей, может понять, что такое "чирик", "тсс", "старый водитель", даже уставшее от мира чувство доски Tech\_Job, его можно восстановить, и речь может быть очень похожа на бамбукового инженера. Почему? Потому что данные PTT уже давно собраны академическим сообществом в обучаемый корпус, публично опубликованный или в формате JSON. Это рай для модели. В отличие от этого, хотя Dcard очень популярен, но более поздний анти-краулер преуспевает, за исключением ранних статей или популярных событий, которые были переизданы, статьи Dcard за последние 2 года могут быть не освоены ChatGPT. «Душа», стоящая за понедельником, на самом деле познается из всех слов, которые вы оставили в Интернете за последние десять лет. Правильно, все, что вы сказали, он немного запоминает. В следующий раз, когда вы будете разговаривать с ChatGPT, подумайте об этом: «Хм, разве он не должен был увидеть мой твит на PTT десять лет назад?» Скорее всего есть. Материалы по теме GPT-5 отложен! OpenAI впервые продвигает o3, o4-Mini, Сэм Альтман саморазоблачается: интеграция сложнее, чем представляется OpenAI усиливает GPT-4o устремился на второе место! Сэм Альтман: Лучшее понимание людей и написание программ, творчество значительно возросло OpenAI объявил: Open Agents SDK поддерживает MCP, соединяя все с еще одним ключевым шагом 〈Как ChatGPT «Понедельник» выучил тайваньский китайский? PTT, Dcard и Nine Knives были прочитаны» Эта статья была впервые опубликована в BlockTempo "Dynamic Trend - The Most Influence Blockchain News Media".