Ученые приспособили поисковый сервис Google для проведения масштабных лингвистических исследований. С его помощью специалисты, используя 5 миллионов отсканированных книг, смогли проследить эволюцию языка в последние 200 лет.
Ученые приспособили поисковый сервис Google для проведения масштабных лингвистических исследований. С его помощью специалисты, используя 5 миллионов отсканированных книг, смогли проследить эволюцию языка в последние 200 лет. Статья специалистов опубликована в журнале Science, а коротко о работе пишет New Scientist.
До сих пор у лингвистов не было инструмента, при помощи которого можно было бы проанализировать значительное количество текстов. Авторы нового исследования работали с книгами, которые были переведены в цифровой формат к настоящему моменту — всего их насчитывается около 15 миллионов. Ученые выбрали из них треть текстов (5,2 миллиона книг, написанных на английском, французском, испанском, немецком, китайском и русском языках) и составили базу всех использованных в них слов — их получилось около 500 миллиардов. Базу слов Ngrams можно найти здесь — поиск по словам осуществляется на базе алгоритмов Google.
Источник здесь
Образовательный блог учителя русского языка и литературы Валентины Васильевны Саблиной для учеников, учителей и всех, кто хочет больше узнать о языке и литературе, об использовании современных технологий, нейросетей, в частности, в работе учителя
Главная страница К экзаменам Ученические работы Для уроков Круг чтения Мои эссе
Подписаться на:
Комментарии к сообщению (Atom)
Комментариев нет:
Отправить комментарий