Grammarly створила перший анотований GEC-корпус української мови і зробила його open-source
21.01.21
Сервис Grammarly анонсував створення та публікацію у відкритому доступі першого анотованого GEC-корпусу української мови.
Grammatical Error Correction — виправлення граматичних помилок, мовний корпус — сукупність текстів, авторами яких є звичайні люди. Призначення корпусу — наукове та практичне вивчення мови. Схожі корпуси існують для багатьох мов, але до сьогодні не було такого анотованого корпусу для вивчення української мови.
Презентований GEC-корпус української мови налічує понад тисячу різножанрових текстів (а це більш ніж 20 000 речень), що їх написали майже 500 волонтерів з усієї України і з-за кордону.
Окрім того, проєкт зі збору та наповнення GEC-корпусу української мови стає постійним у компанії Grammarly і буде частиною внеску Grammarly у розвиток українського NLP (natural language processing — опрацювання природної мови).
Команда Grammarly продовжить наповнювати корпус текстами за допомогою вебсайту проєкту, а також працюватиме над удосконаленням його технічної цінності, щоб збільшити його значення для наукової спільноти.
Розробники вважають, що корпус може мати позитивний вплив на:
- Створення нових онлайн-систем виправлення граматики в українськомовних текстах. Українська мова входить до 50 найпоширеніших мов світу; водночас якісних текстових ресурсів для дослідження української зараз існує небагато. Створений корпус надає українській дослідницькій спільноті ще один інструмент для опрацювання природної мови і може прискорити розвиток українських комунікаційних асистентів.
- Сприяння використанню якісної української мови в онлайні. Цей корпус буде корисним для наукової спільноти, адже надасть більше інструментів для досліджень та в результаті буде корисним для тих, хто спілкується українською онлайн.
Дізнатися більше про розробку і підтримати проект можна за посиланням: ua-gec-dataset.grammarly.com.

влажность:
давление:
ветер:

Обзор флешки Kioxia TransMemory U365: продуктивное чтение



Расскажем о компактном флеш-накопителе с высокой скоростью чтения данных от известного бренда твердотельной памяти — Kioxia TransMemory U365

В десктопном WhatsApp появилась поддержка голосовых и видеозвонков
WhatsApp мессенджер обновлениеWhatsApp добавила для всех пользователей возможность совершать голосовые и видеозвонки для компьютеров с Windows и macOS
Материнская плата ASUS ProArt B550 Creator оснащена разъёмами Thunderbolt 4
AMD ASUS Thunderbolt USB Type-C материнская платаASUS представила плату ProArt B550 Creator на AMD B550 и имеет два интерфейса Thunderbolt 4 (USB Type-C) с поддержкой DisplayPort
