Что такое Google books ngram viewer

Аннотация научной статьи по прочим медицинским наукам, автор научной работы — Кремнев Илья Юрьевич

В статье рассмотрены вопросы эволюции и разграничения терминов в области изучения промышленного производства на примере одной из отраслей – табачной. Анализ проведен с применением онлайн-ресурса «Google Books Ngram Viewer» для выявления частоты встречаемости терминов и понятий за определенный период времени по русскому языковому корпусу сервиса. Выявлены наиболее вероятные первоначальные упоминания в литературе (первоисточники), тенденции и динамика применения терминов в сфере научных исследований, установлены наиболее популярные (в количестве 10 ед.) запросы и их периодизация.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по прочим медицинским наукам , автор научной работы — Кремнев Илья Юрьевич

ИГРОФИКАЦИЯ В ПРОЦЕССЕ ПОДБОРА КАДРОВ ЦИФРОВОЙ ЭКОНОМИКИ
Использование возможностей цифровой библиотеки Google в исследовании непрерывного образования
Опыт корпусно-ориентированного историко-культурного исследования исторической и политической лексики
Был ли капитализм? Анализ русской языковой среды в XIX и XX веках с помощью больших данных

Google Books Ngram Viewer meme — (tik tok compilation)

О модели интегративной образовательной среды при подготовке специалистов для системы МЧС
i Не можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

APPLICATION OF THE GOOGLE BOOKS NGRAM VIEWER ONLINE SERVICE TO STUDY THE EVOLUTION OF TERMS IN THE FIELD OF THE TOBACCO INDUSTRY CONCEPT APPARATUS

The article deals with the evolution and differentiation of terms in the field of industrial production studies on the example of one of the branches – tobacco. The analysis was carried out using the online resource «Google Books Ngram Viewer» to identify the frequency of occurrence of terms and concepts for a certain period in the Russian language corpus of the service. The most probable initial references in periodicals (primary sources), trends and dynamics of the use of terms in the field of scientific research are identified, the most popular (in the amount of 10 units) queries and their periodization are established.

Как узнать Google client id

Текст научной работы на тему «ПРИМЕНЕНИЕ ОНЛАЙН-СЕРВИСА GOOGLE BOOKS NGRAM VIEWER ДЛЯ ИЗУЧЕНИЯ ЭВОЛЮЦИИ ТЕРМИНОВ В ОБЛАСТИ ПОНЯТИЙНОГО АППАРАТА ТАБАЧНОЙ ПРОМЫШЛЕННОСТИ»

«Научные исследования и инновации»

3. Jesse Schell. The Art of Game Design: A Book of Lenses. — Second Edition.

— A K Peters/CRC Press, 2019. — 654 p.

4. Betty Adamou. Games and Gamification in Market Research: Increasing Consumer Engagement in Research for Business. — First Edition. — Kogan Page, 2018.

Кремнев Илья Юрьевич Kremnev Ilia Yurevich

Балтийский федеральный университет им. И. Канта Immanuel Kant Baltic Federal University

ПРИМЕНЕНИЕ ОНЛАЙН-СЕРВИСА GOOGLE BOOKS NGRAM VIEWER ДЛЯ ИЗУЧЕНИЯ ЭВОЛЮЦИИ ТЕРМИНОВ В ОБЛАСТИ ПОНЯТИЙНОГО АППАРАТА ТАБАЧНОЙ ПРОМЫШЛЕННОСТИ

Google Books Ngram Viewer: Когда в истории были публикации о чем-то

APPLICATION OF THE GOOGLE BOOKS NGRAM VIEWER ONLINE SERVICE TO STUDY THE EVOLUTION OF TERMS IN THE FIELD OF THE TOBACCO INDUSTRY CONCEPT APPARATUS

Аннотация: В статье рассмотрены вопросы эволюции и разграничения терминов в области изучения промышленного производства на примере одной из отраслей — табачной. Анализ проведен с применением онлайн-ресурса «Google Books Ngram Viewer» для выявления частоты встречаемости терминов и понятий за определенный период времени по русскому языковому корпусу сервиса. Выявлены наиболее вероятные первоначальные упоминания в литературе (первоисточники), тенденции и динамика применения терминов в сфере научных исследований, установлены наиболее популярные (в количестве 10 ед.) запросы и их периодизация.

VМеждународная научно-практическая конференция

Abstract. The article deals with the evolution and differentiation of terms in the field of industrial production studies on the example of one of the branches — tobacco. The analysis was carried out using the online resource «Google Books Ngram Viewer» to identify the frequency of occurrence of terms and concepts for a certain period in the Russian language corpus of the service. The most probable initial references in periodicals (primary sources), trends and dynamics of the use of terms in the field of scientific research are identified, the most popular (in the amount of 10 units) queries and their periodization are established.

Ключевые слова. эволюция терминов, табачная промышленность, табачная индустрия, табачная отрасль, Google Books Ngram Viewer.

Key words. evolution of terms, tobacco industry, Google Books Ngram Viewer.

Google Chrome application что это

Использование диахронического метода является актуальным направлением современных исследований, поскольку предполагает изучение различных идей, фактов, событий в их историческом становлении и развитии. Данный инструмент анализа рассматривается исследователями во многих работах фундаментальных и прикладных наук.

Одним из инструментов такого анализа выступает современный и постоянно обновляемый онлайн — сервис «Google Books Ngram Viewer», который был разработан группой ученых Гарвардского университета в 2010 году для исследований в области культурологии, иностранных языков, географии, психологии, социологии и других гуманитарных направлений [1, с. 16]. На платформе используется более 25 миллионов книжной периодики. Сервис получил достаточное признание и используется исследователями в различных областях, в том числе в изучении экономических процессов.

Согласно одной из общепринятых концепций изучение вопросов промышленного характера происходит по мере повышения иерархического уровня анализируемых систем: продукт — отрасль — промышленность страны в целом [2, с. 218]. При рассмотрении отдельных исследовательских аспектов в табачном производстве зачастую ставится вопрос каким именно терминологическим аппаратом правильнее всего пользоваться.

«Научные исследования и инновации»

Понятие «промышленность» в современной экономической географии не

имеет четкого определения, более того в иностранной (особенно англоязычной) литературе оно отсутствует. Термин «индустрия», перенятый как раз из английского языка, означает больше «отрасль», нежели чем «промышленность». В связи с этим возникает проблема использования данных понятий в контексте научных работ.

В основу исследования легли 3 термина: табачная промышленность, табачная индустрия и табачная отрасль. Изучение частоты упоминания терминов проводилось по одному языковому корпусу — русскому. Изучаемый период — с 1800 по 2019 год (максимально возможный на сервисе). Сглаживание выбрано на значении: 3.

Использование термина «табачная промышленность» достаточно широкое, под которым подразумевается выпуск сырья и самих табачных изделий. Полученный график демонстрирует скачкообразное движение встречаемости исследуемого сочетания в русском корпусе книг. Первое найденное упоминание в литературе датируется 1845 годом («Атлас промышленности Московской Губернии», составленный Л. Самойловым); после 1932 года наблюдается устойчивый рост с пиковым значением в 1937 году, затем наблюдается резкий спад, связанный с периодом войны 1941-1945 годов. Отмечается долгосрочная динамика изменения частотности использования введенного термина (рис.1). Основные литературные источники посвящены народному хозяйству союзных республик.

Рис. 1. Частота использования словосочетания «табачная промышленность» в книжной периодике с 1800 по 2019 гг., %,

Термин «индустрия» имеет более широкое понятие, однако в контексте табачного производства появляется в периодике лишь во время рассвета СССР (первое упоминание приходится на 20-ые годы XX века: «Контрольные цифры народного хозяйства СССР» 1927 года издания). График показывает рост встречаемости данного словосочетания с пиковыми отметками в 2000 и 2013 году, в основном это связано с переводом англоязычной литературы (в которых «industry» равняется «индустрия») на русский язык. Отмечается среднесрочная динамика использования словосочетания (рис.2). Основные работы посвящены антитабачному движению: отказу от курения, здоровому образу жизни.

Невозможно установить безопасное соединение Гугл

Рис. 2. Частота использования словосочетания «табачная индустрия» в книжной периодике с 1800 по 2019 гг., %.

«Научные исследования и инновации»

Понятие «отрасль» в русскоязычной литературе, посвященной экономике стран, исследуется как часть «большой» промышленности. В Российской Федерации табачный сектор рассматривается (в статистических обзорах, отчетах и др.) как отрасль пищевой и сельскохозяйственной промышленности. Полученный график отображает рост встречаемости словосочетания в период с 1951 года по 2003 год, затем наблюдается снижение по 2015 г. Первое упоминание встречается в 1947 году в работе В. Зотова «Развитие пищевой промышленности в новой пятилетке». Отмечается среднесрочная динамика изменения частотности использования термина (рис.3). Основные работы направлены на дальнейшее развитие табачной отрасли, разрабатываются

0.000000260% -0.000000240% -0.000000220% -0.000000200% -0.000000180%-0.000000160%-0.000000140%-0.000000120%-0.000000100%-0.000000080% -0.000000060% -0.000000040% -0.000000020% —

1800 1820 1840 1860 1880 1900 1920 1940 1960 1980 2000

(click on line/label for focus)

Рис. 3. Частота использования словосочетания «табачная отрасль» в книжной периодике с 1800 по 2019 гг., %.

Используемый сервис «Google Books Ngram Viewer» также предлагает инструкцию для определения наиболее популярных запросов с необходимым словом или словосочетанием [3]. Для проверки была выбрана основа «табачная . ». График показал, что среди 10 самых популярных запросов из 3 исследуемых словосочетаний используется только «табачная промышленность». В список вошли понятия: «табачная фабрика», «табачная лавка», «табачная плантация» и другие (рис.4).

Рис. 4. Частота использования и периодизация наиболее популярных запросов со словосочетанием «табачная . » в книжной периодике с 1800

Таким образом, использование всех трех терминов актуально и по сей день. В зависимости от выбранной цели исследования авторы выбирают необходимый понятийный аппарат, так если рассматривать табачную сферу как часть пищевой и сельскохозяйственной промышленности, то уместнее использование термина «отрасль», если описывать как совокупность обработки сырья и выпуск готовой продукции — «промышленность», а значение «индустрия» в области «целиковой» табачной промышленности мира. Стоит отметить, что выбор терминологии зачастую в данной сфере происходит на интуитивном уровне, поэтому возможны различные применения терминов. Согласно исследованию, наиболее часто используемое и продолжительное по времени понятие в русскоязычной литературе — «промышленность».

Как сбросить аккаунт Гугл на BQ strike mini

Диахронический метод с использованием возможностей онлайн-сервиса Google Books Ngram Viewer в сочетании с квалитативным анализом литературы позволил проследить эволюцию, динамику терминов в области исследования табачной промышленности. В этом есть перспектива для дальнейших исследований.

«Научные исследования и инновации» Библиографический список:

1. Московии В. М., Сапрыкина Т. В. Об эволюции терминов, обозначающих дистаициоииое обучение, с помощью сервиса Google Books Ngram Viewer // Научно-техническая информация. Сер. 2. Информационные процессы и системы. Белгород, 2018. С. 15-20.

2. Горкин А. П. География постиндустриальной промышленности (методология и результаты исследований, 1973 — 2012 годы) / А. П. Горкин. -Смоленск: Ойкумена, 2012 — 348 с.

Источник: cyberleninka.ru

Что такое Google Ngram?

В недрах Google Labs на свет родился мощный сервис NGram, который перебирает исполинскую базу оцифрованных книг Google и позволяет выявить частоту употребления слов и фраз в книгах в разные исторические периоды.

Google Ngram Viewer: Сталин популярнее Ленина, а слово Интернет появилось в конце 19 века.
таковы расчеты сервиса Books Ngram Viewer — новой филологической онлайн-игрушки от корпорации Google.
Крупнейший мировой поисковик прогнал через свои фильтры все литературное наследие человечества за последние 200 лет. Что из этого получилось, рассказывается в очередном выпуске научно-популярной программы «Инфомания» , которая выходит на канале СТС.
«Откуда в 19-м веке слово „интернет“?» — недоумевают пользователи нового сервиса Books Ngram Viewer, которые обнаружили первые сообщения о глобальной Сети в далеких 1890-х годах. «В любой системе есть погрешности» , — честно отвечают разработчики Google. Впрочем, они тут же добавляют, что у слова «интернет» имеется одно устаревшее значение и предлагают пользователям его найти.

Праздные блоггеры бьются над этой задачей уже больше месяца. Лингвистическую программу на платформе поисковика Google запустили гарвардские ученые. Они закачали на сервер около 5 миллионов книг, опубликованных за период c 1800 по 2009 год. Любой желающий теперь может проследить, с какой частотой определенные слова упоминались на протяжении веков.
Поиск доступен на семи языках: английском, французском, немецком, испанском, иврите, русском и упрощенном китайском. Особое место отведено английскому — он здесь подразделяется на «общий» , «художественный» , «британский» и «американский» . Система позволяет проводить сопоставительный анализ — к примеру, Ленин упоминается в литературе на русском языке гораздо чаще, чем Сталин, в том числе и после 2000 года, что легко можно проследить на графике, если ввести эти фамилии через запятую в строку поиска. По этой причине сервис привлек внимание серьезных исследователей — человеку и целой жизни не хватит, чтобы проанализировать 5 миллионов источников, а компьютерная программа проделывает эту операцию за несколько секунд. Под онлайн-сервис в Гарварде придумали и целую науку, которую решили назвать «культуромикой» . Дело в том, что отсканированные книги в основном посвящены вопросам культуры и общества, здесь нет технической литературы. Измерять частоту упоминаний ученые предложили в «миллидарвинах» — согласно графикам Books Ngram Viewer, по популярности Дарвин обгоняет самого Эйнштейна.
Для основной массы пользователей интернета новая услуга от Google стала очередным развлечением, помогающим развеять тоску офисных будней. К примеру, многие юзеры принялись забивать в поиск названия популярных социальных сетей. Английский язык более гибкий и восприимчивый к нововведениям, чем русский: слово Facebook, например, стало нарицательным и даже образовало устоявшуюся глагольную форму, официально включенную в онлайн-словари. «She learned that her current employer Facebooked her before hiring her» — «Она узнала, что нынешний работодатель профэйсбучил ее, прежде чем взять на работу» , — гласит пример употребления в одной из словарных статей.

Как забанить Гугл почту

Остальные ответы

Источник: otvet.mail.ru

Описание системы Google books Ngram Viewer

Общие сведения. Система Google books Ngram Viewer является в настоящее время наиболее мощным инструментом диахронических исследований. Доступ к ней открыт, начиная примерно с 2009 года. Google books Ngram Viewer представляет собой информационную систему, которая содержит несколько корпусов размеченных текстов книг на 9 языках. Каждый корпус (кроме итальянского) имеет две версии — 2009 и 2012 года.

Система также содержит отдельно корпус британского и американского английского языка, корпус всех вариантов английского языка, корпус художественной литературы на английском языке и так называемый гугловский миллион — книги на английском языке с годами издания с 1500 до 2008. Для одного года издания отбиралось не более 6000 книг. Это означает, что для ранних лет издания в БД присутствуют все отсканированные книги, тогда как книги более поздних лет представлены выборочно. Отбор отражает распределение по тематике, характерное для данного года. Самые поздние публикации, доступные для пользователей в настоящее время, относятся к 2008 году.

Объем. На конец 2012 г. база данных насчитывала более 8 млн книг (текстов), что составляет около 6% всех когда-либо опубликованных печатных книг. Корпус книг на русском языке (2012 г.) содержит 591 310 книг (текстов) или 67 137 666 353 словоупотреблений.

Таблица 1 Количественная характеристика корпуса в целом (по данным 2012 года)

Источник: studwood.net

Рейтинг
Загрузка ...