В ТГУ разработали нейросеть для написания новостей

Сотрудники лаборатории лингвистической антропологии филологического факультета ТГУ и магистранты автономной магистерской программы «Компьютерная и когнитивная лингвистика» создали онлайн-сервис по автоматическому анализу и генерации новостных текстов «WORLD2NEWS». Об этом 21 декабря сообщила пресс-служба ТГУ.

Задача сервиса - ускорить сбор информации, публикации новости и решить вопрос с достоверностью журналистских материалов. Проект разрабатывается и будет реализован совместно с партнером ТГУ — международной группой IT-компаний «Элекард».

Разработанная нейросеть способна создавать и проверять новости с помощью нейронных сетей и синтаксических программ, проводящих анализ данных с веб-ресурсов. Они работают на основе лингвистического преданализа особенностей текста, создания тематических словарей и формальных грамматик. Нейросеть извлекает из неструктурированных текстов факты (по модели «кто, что, где, когда») и синтезирует заголовок новости. Если на поиск и анализ у журналиста уходит минимум пять минут, то машина справляется с этим в считанные секунды. При этом ценность журналиста как творческой единицы, способной к аналитике и интерпретации, становится выше.

Аналогичные программы уже существуют, но функционал созданного молодыми учёными ТГУ сервиса гораздо шире. Например, пользователь может выбрать вариант заголовка как полностью собранного нейросетью, так и образованного при помощи формальных грамматик, что позволяет формировать и стиль новостного текста. Преимущество «WORLD2NEWS» — высокая формальная точность. Это делает сгенерированные тексты максимально похожими на журналистские. Точность определяется по показателям BLEU-score, алгоритма оценки качества текста, автоматически переведенного с одного естественного языка на другой. Качество перевода определяется правилом: «чем ближе машинный перевод к профессиональному человеческому переводу, тем лучше».

Ранее члены команды рассказывали о том, что работа начиналась как обычный студенческий проект. Уже в процессе реализации был создан сервис с набором востребованных при автоматической обработки текстовой информации функций.

Разработчики онлайн-сервиса не собираются останавливаться на достигнутом. Пока что «WORLD2NEWS» — лишь действующий прототип. В планах работа по оптимизации формальных грамматик и разработке новых решений, основанных на нейронных сетях.

URL: https://babr24.com/tmk/?IDE=208647

bytes: 2444 / 2371

Поделиться в соцсетях:

Экслюзив от Бабра в соцсетях:
- Телеграм
- ВКонтакте
- Вайбер
- Одноклассники

Связаться с редакцией Бабра в Томской области:
[email protected]

Автор текста: Пепел.

Другие статьи в рубрике "Интернет и ИТ" (Томск)

Иркутский Телеграм: новое племя. Предпочтения читателей в январе 2024

Скажи, кто твой друг, и я скажу, кто ты. Или в современном прочтении: скажи мне, чьи новости ты читаешь, а я скажу, что ты за человек.

Глеб Севостьянов

Интернет и ИТПолитикаОбществоМир Иркутск

7432

06.02.2024

Ретрансляторы, Арктика, ТУСУР — эти слова приводят в восторг даже замсекретаря генсовета «Единой России»

Томский госуниверситет систем управления и радиоэлектроники (ТУСУР) вместе с компанией «СТК» разрабатывают ретрансляторы связи для Арктики на базе вузовской лаборатории в IT-парке «Герцен».

Соня Совушкина

Интернет и ИТНаука и технологииОбществоТомск

8773

05.12.2022

Tele2 улучшила условия международного роуминга для россиян в Катаре

Tele2, российский оператор мобильной связи, предложил выгодные условия общения для спортивных болельщиков во время главного футбольного события года в Катаре. Tele2 сделала общедоступными услуги для выгодного использования мобильного интернета в международном роуминге в Катаре.

Ярослава Грин

Интернет и ИТТуризмМир Россия

10386

25.11.2022

Пробиваем дно раньше всех: в Томске вынесен первый приговор за использование VPN

Томский районный суд первый в России приговорил томича к трем годам ограничения свободы за использование VPN-программы, квалифицировав данное деяние по статье 273 Уголовного кодекса РФ (вредоносные программы).

Соня Совушкина

Интернет и ИТМаразмРасследованияТомск

30944

24.11.2022

Майнинг: польза, вред, перспективы

Доходы российских майнеров за 2021 год составили порядка 4,5 миллиарда долларов. Впрочем, ни федеральный бюджет, ни региональные бюджеты налогов с этой прибыли не увидели – почти все средства были выведены за рубеж и осели на иностранных счетах.

Соня Ломачевская

Интернет и ИТКриминалЭкономика и бизнесМир Россия Иркутск

24477

19.05.2022

Инсайд. Рынок криптовалют нуждается в регламенте

Относительно цифровых финансовых активов и возможности их оборота в РФ, хочу резюмировать нашу позицию, которая выработана вместе с индустрией и экспертами по кибербезопасности. Необходимо обеспечивать защиту средств граждан, разделив их на квалифицированных и неквалифицированных инвесторов.

Александр Якубовский

Интернет и ИТМир Россия

5768

07.04.2022

Удержать любой ценой: Минцифры предложило айтишникам льготную ипотеку и отсрочку от призыва

В ведомстве считают, что программа поддержки, в которую входит отмена НДФЛ, отсрочка от армии и льготная ипотека способна задержать специалистов в России.

Анна Амгейзер

Интернет и ИТОбществоПолитикаМир Россия

26230

01.03.2022

В ТГУ создадут математическую модель для оценки эпидбезопасности

Магистрантка Томского государственного университета Анна Первушина работает над созданием ресурса, который будет автоматически оценивать эпидемиологическую безопасность стран и прогнозировать ситуацию.

Пепел

Интернет и ИТНаука и технологииЗдоровьеТомск

11114

11.02.2022

Томский сетевой тролль угрожает журналистам

За все время занятий журналистикой, особенно расследовательской журналистикой на протяжении последних 10 лет, угрозы я получал многократно, причем от самых разных лиц.

Станислав Станов

Интернет и ИТРасследованияТомск

22065

20.12.2021

Денис Вишняк обиделся, что его "творчество" по части кинематографа перестали считать искусством

Фильм "Мне теперь с этим жить", в котором в главной роли снялся участник группы "ЮДИ" Денис Вишняк (депутат думы Томска, член партии "Единая Россия"), вызвал крайнее возмущение у томских медиков.

Соня Совушкина

Интернет и ИТСкандалыОбществоТомск

5479

16.11.2021

Россия вошла топ-3 стран с самым несвободным интернетом в мире

Россия, где свобода слова закреплена на законодательном уровне, заняла третье место в антирейтинге свободы интернета. Уступила она только Китаю и Кубе. Цифровая свобода существует не для всех. А вот цензура – напротив, как бы нас не убеждали в обратном заинтересованные лица.

Анна Амгейзер

Интернет и ИТОбществоМир Россия Китай

7140

16.11.2021

Технологический Томск сегодня: IT, экономическая зона, инвестиции и инновации

Президент Томской торгово-промышленной палаты Максим Костарев дал большое интервью «Интерфакс».

Пепел

Интернет и ИТНаука и технологииЭкономика и бизнесТомск

23048

02.09.2021

Лица Сибири

Семенов Евгений

Шагин Андрей

Тарханов Николай

Зураев Игорь

Никитин Анатолий

Зубарев Игорь

Воронов Денис

Падерин Валерий

Гаськов Владимир

Брилка Иван