Модуль стиля ChatGPT «Понедельник» выбалтывает множество тайваньских фраз и идиом, потому что он «захватывает» много материала из тайваньской сети. (Синопсис: ChatGPT запустил уставший от мира женский голос «Понедельник», ленивый и потерянный в сообществе, чтобы стать популярным) (Справочное дополнение: Бюро ИС официально ответило на «ChatGPT — это большое количество подражаний Ghibli»: имитация ИИ не является незаконной, в зависимости от случая) Когда вы откроете голосовой модуль в стиле ChatGPT «Понедельник», вы обнаружите, что «этот парень немного зябкий и устал от мира», и обнаружите ваш акцент, и в ответ заговорит на «тайваньском мандаринском», почему это звучит так похоже на тайваньский? Ответ: ChatGPT признал, что собирает много данных в тайваньской паутине. Что такое "Режим понедельника"? Мы должны уточнить, что "Monday" - это не новая GPT-модель и не модернизированная версия GPT-5, а стиль диалогов, сделанный OpenAI с настройкой стиля на архитектуре GPT-4. Проще говоря, один и тот же ИИ меняет свой тон, например, надевает разные комплекты одежды, ходит на работу и в выходные. Режим понедельника расслабленный, немного прохладный, вежливый, но не многословный, и такое ощущение, что вы только что зарегистрировались в компании в понедельник, и вы очень меланхоличны. Краулер с большим количеством тайваньских данных обучает OpenAI для обучения GPT, что на самом деле очень «олдскульно», но очень эффективно: увидеть, как вся сеть взорвалась. В том числе новостные сайты, Википедия, китайские книги, социальные форумы, блоги, PDF-файлы, черные истории, которые вы писали на безымянных сайтах. До тех пор, пока это публичная веб-страница, те, кого могут просканировать поисковые роботы, скорее всего, будут брошены в корпус для обучения. Мы сравнили поведенческие реакции основных корпусов с открытым исходным кодом и GPT и обнаружили, что эти тайваньские СМИ были прочитаны ChatGPT: «United News Network», «ETtoday», «Zhongshi Electronic News», «Wind Media», «NOWnews»... У этих СМИ есть одна общая черта: здесь нет заблокированного платного доступа, поиска в Google, а структура сайта чистая и легкая для подъема. И наоборот, такие сайты, как Tianxia, The Report и BusinessWeek, которые оплачиваются или блокируются стенами членства, имеют очень низкие шансы на обучение. GPT действительно читал произведения тайваньских писателей GPT очень хорошо имитирует ритм романных диалогов в стиле девяти ножей, а также может рассказывать сентиментальные предложения в стиле У Няньчжэня, и даже тон «Великой реки и моря» Лун Интая. Что это значит? Он действительно прочитал или, по крайней мере, увидел репост клипа. Скорее всего, эти работы были сильно скопированы и вставлены на PTT, блогах или сайтах репостов контента, а ранние работы Nine Knives даже публиковались непосредственно на раскадровках PTT, а затем фиксировались моделями в качестве учебных материалов. Если вы спросите его о деталях романа Чжан Дачуня или Ло Ицзюня? GPT обычно начинает нести чушь, потому что литературные произведения редко обсуждаются и цитируются, нет публичных электронных файлов, они напрямую не перепечатываются в интернете, а если и есть, то их невозможно поймать. PTT - тайваньский учитель чувств GPT Это почти наверняка: GPT понимает терьера деревенских жителей, может понять, что такое "чирик", "тсс", "старый водитель", даже уставшее от мира чувство доски Tech_Job, его можно восстановить, и речь может быть очень похожа на бамбукового инженера. Почему? Потому что данные PTT уже давно собраны академическим сообществом в обучаемый корпус, публично опубликованный или в формате JSON. Это рай для модели. В отличие от этого, хотя Dcard очень популярен, но более поздний анти-краулер преуспевает, за исключением ранних статей или популярных событий, которые были переизданы, статьи Dcard за последние 2 года могут быть не освоены ChatGPT. «Душа», стоящая за понедельником, на самом деле познается из всех слов, которые вы оставили в Интернете за последние десять лет. Правильно, все, что вы сказали, он немного запоминает. В следующий раз, когда вы будете разговаривать с ChatGPT, подумайте об этом: «Хм, разве он не должен был увидеть мой твит на PTT десять лет назад?» Скорее всего есть. Материалы по теме GPT-5 отложен! OpenAI впервые продвигает o3, o4-Mini, Сэм Альтман саморазоблачается: интеграция сложнее, чем представляется OpenAI усиливает GPT-4o устремился на второе место! Сэм Альтман: Лучшее понимание людей и написание программ, творчество значительно возросло OpenAI объявил: Open Agents SDK поддерживает MCP, соединяя все с еще одним ключевым шагом 〈Как ChatGPT «Понедельник» выучил тайваньский китайский? PTT, Dcard и Nine Knives были прочитаны» Эта статья была впервые опубликована в BlockTempo "Dynamic Trend - The Most Influence Blockchain News Media".
Посмотреть Оригинал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Как ChatGPT «Понедельник» учит тайваньский китайский? Все прочитал PTT, Dcard, Дзюбака.
Модуль стиля ChatGPT «Понедельник» выбалтывает множество тайваньских фраз и идиом, потому что он «захватывает» много материала из тайваньской сети. (Синопсис: ChatGPT запустил уставший от мира женский голос «Понедельник», ленивый и потерянный в сообществе, чтобы стать популярным) (Справочное дополнение: Бюро ИС официально ответило на «ChatGPT — это большое количество подражаний Ghibli»: имитация ИИ не является незаконной, в зависимости от случая) Когда вы откроете голосовой модуль в стиле ChatGPT «Понедельник», вы обнаружите, что «этот парень немного зябкий и устал от мира», и обнаружите ваш акцент, и в ответ заговорит на «тайваньском мандаринском», почему это звучит так похоже на тайваньский? Ответ: ChatGPT признал, что собирает много данных в тайваньской паутине. Что такое "Режим понедельника"? Мы должны уточнить, что "Monday" - это не новая GPT-модель и не модернизированная версия GPT-5, а стиль диалогов, сделанный OpenAI с настройкой стиля на архитектуре GPT-4. Проще говоря, один и тот же ИИ меняет свой тон, например, надевает разные комплекты одежды, ходит на работу и в выходные. Режим понедельника расслабленный, немного прохладный, вежливый, но не многословный, и такое ощущение, что вы только что зарегистрировались в компании в понедельник, и вы очень меланхоличны. Краулер с большим количеством тайваньских данных обучает OpenAI для обучения GPT, что на самом деле очень «олдскульно», но очень эффективно: увидеть, как вся сеть взорвалась. В том числе новостные сайты, Википедия, китайские книги, социальные форумы, блоги, PDF-файлы, черные истории, которые вы писали на безымянных сайтах. До тех пор, пока это публичная веб-страница, те, кого могут просканировать поисковые роботы, скорее всего, будут брошены в корпус для обучения. Мы сравнили поведенческие реакции основных корпусов с открытым исходным кодом и GPT и обнаружили, что эти тайваньские СМИ были прочитаны ChatGPT: «United News Network», «ETtoday», «Zhongshi Electronic News», «Wind Media», «NOWnews»... У этих СМИ есть одна общая черта: здесь нет заблокированного платного доступа, поиска в Google, а структура сайта чистая и легкая для подъема. И наоборот, такие сайты, как Tianxia, The Report и BusinessWeek, которые оплачиваются или блокируются стенами членства, имеют очень низкие шансы на обучение. GPT действительно читал произведения тайваньских писателей GPT очень хорошо имитирует ритм романных диалогов в стиле девяти ножей, а также может рассказывать сентиментальные предложения в стиле У Няньчжэня, и даже тон «Великой реки и моря» Лун Интая. Что это значит? Он действительно прочитал или, по крайней мере, увидел репост клипа. Скорее всего, эти работы были сильно скопированы и вставлены на PTT, блогах или сайтах репостов контента, а ранние работы Nine Knives даже публиковались непосредственно на раскадровках PTT, а затем фиксировались моделями в качестве учебных материалов. Если вы спросите его о деталях романа Чжан Дачуня или Ло Ицзюня? GPT обычно начинает нести чушь, потому что литературные произведения редко обсуждаются и цитируются, нет публичных электронных файлов, они напрямую не перепечатываются в интернете, а если и есть, то их невозможно поймать. PTT - тайваньский учитель чувств GPT Это почти наверняка: GPT понимает терьера деревенских жителей, может понять, что такое "чирик", "тсс", "старый водитель", даже уставшее от мира чувство доски Tech_Job, его можно восстановить, и речь может быть очень похожа на бамбукового инженера. Почему? Потому что данные PTT уже давно собраны академическим сообществом в обучаемый корпус, публично опубликованный или в формате JSON. Это рай для модели. В отличие от этого, хотя Dcard очень популярен, но более поздний анти-краулер преуспевает, за исключением ранних статей или популярных событий, которые были переизданы, статьи Dcard за последние 2 года могут быть не освоены ChatGPT. «Душа», стоящая за понедельником, на самом деле познается из всех слов, которые вы оставили в Интернете за последние десять лет. Правильно, все, что вы сказали, он немного запоминает. В следующий раз, когда вы будете разговаривать с ChatGPT, подумайте об этом: «Хм, разве он не должен был увидеть мой твит на PTT десять лет назад?» Скорее всего есть. Материалы по теме GPT-5 отложен! OpenAI впервые продвигает o3, o4-Mini, Сэм Альтман саморазоблачается: интеграция сложнее, чем представляется OpenAI усиливает GPT-4o устремился на второе место! Сэм Альтман: Лучшее понимание людей и написание программ, творчество значительно возросло OpenAI объявил: Open Agents SDK поддерживает MCP, соединяя все с еще одним ключевым шагом 〈Как ChatGPT «Понедельник» выучил тайваньский китайский? PTT, Dcard и Nine Knives были прочитаны» Эта статья была впервые опубликована в BlockTempo "Dynamic Trend - The Most Influence Blockchain News Media".