Частотные словари: как создаётся словарный контент Downpat

Чтобы изучение английского было максимально эффективным, Downpat строит свой словарный контент на основе научных частотных словарей. Каждое слово имеет уровень сложности по шкале CEFR, частотный ранг и тщательно подготовленные объяснения. На этой странице мы рассказываем, какие источники используются и как они объединяются в единую систему.

Почему частотность важна

В английском языке более миллиона слов, но для повседневного общения достаточно значительно меньше. Исследования показывают, что 2000–3000 самых частотных слов покрывают около 90–92% всех текстов, которые вы встретите в реальной жизни. Именно поэтому эффективное обучение начинается с самых важных слов, а не случайных списков.

Downpat использует частотное ранжирование, чтобы вы изучали сначала те слова, которые встречаются чаще всего. Это означает, что каждая минута обучения приносит максимальную отдачу.

Oxford 5000 — основной источник

Oxford 5000 — это список из 5000 важнейших английских слов, подготовленный издательством Oxford University Press. Это основной источник словарного контента Downpat.

Почему именно Oxford 5000:

  • Уровни CEFR — каждое слово имеет отметку от A1 (начальный) до C1 (продвинутый)
  • Части речи — существительное, глагол, прилагательное и т.д. — для точного подбора вариантов ответов
  • Определения и примеры — академические пояснения с примерами использования
  • Фонетическая транскрипция — британское и американское произношение (IPA)

Распределение слов по уровням: A1 — 1076, A2 — 990, B1 — 902, B2 — 1571, C1 — 1404 слова.

NGSL — частотное ранжирование

New General Service List (NGSL) — это список из 2809 наиболее частотных английских слов, созданный исследователями Dr. Charles Browne, Dr. Brent Culligan и Dr. Joseph Phillips. Список построен на анализе Cambridge English Corpus объёмом 273 миллиона слов.

NGSL используется в Downpat для частотного ранжирования: каждое слово из Oxford 5000 сопоставляется с NGSL, чтобы получить точный ранг частотности. Благодаря этому слова на ранге 1–50 (be, have, do, say, go) изучаются первыми, а более редкие — позже.

2809 слов NGSL покрывают приблизительно 92% всех английских текстов — от новостей и учебников до повседневных разговоров.

NAWL — академическая лексика

New Academic Word List (NAWL) — это дополнительный список из 963 академических слов, которые часто встречаются в научных текстах, учебниках и университетских лекциях. NAWL дополняет NGSL и особенно полезен для тех, кто готовится к уровням B2–C1 или планирует обучение на английском языке.

Примеры академических слов: analyze, demonstrate, evaluate, hypothesis, significant, methodology.

Как всё это объединяется

Процесс создания словарного контента Downpat состоит из нескольких этапов:

  1. Отбор слов. Слова берутся из Oxford 5000 и фильтруются по уровню CEFR (например, A1 — 782 слова для начинающих).
  2. Частотное ранжирование. Каждое слово сопоставляется с NGSL для получения точного ранга частотности. Слова, которых нет в NGSL, получают оценку на основе корпусов COCA и BNC.
  3. Переводы и примеры. Украинские переводы и примеры употребления создаются вручную, а не автоматическим переводчиком. Это гарантирует педагогическую точность и естественность языка.
  4. Фонетическая транскрипция. К каждому слову добавляется транскрипция IPA и украинская транслитерация для правильного произношения.
  5. Распределение по темам. Слова организуются в темы по ~100 слов в порядке убывания частотности — самые важные слова изучаются первыми.
  6. Варианты ответов. Для тестов множественного выбора дистракторы подбираются из той же части речи, чтобы варианты были грамматически правдоподобными.

Уровни CEFR

Каждое слово в Downpat имеет уровень по Общеевропейским компетенциям владения иностранным языком (CEFR):

  • A1 — базовая лексика для начинающих (782 слова: be, have, go, like, house, family...)
  • A2 — элементарный уровень (990 слов: explain, improve, regular, advantage...)
  • B1 — средний уровень (902 слова: achievement, consequently, participate...)
  • B2 — выше среднего (1571 слово: appropriate, genuine, negotiate, substantial...)
  • C1 — продвинутый (1404 слова: ambiguous, compelling, inevitable, profound...)

Такая градация позволяет изучать слова в правильном порядке: от базовых к сложным.

Источники

  • Oxford 5000 — Oxford University Press / Oxford Learner's Dictionaries. 5000 важнейших английских слов с уровнями CEFR, определениями и фонетикой.
  • NGSL v1.2 — Dr. Charles Browne, Dr. Brent Culligan, Dr. Joseph Phillips. 2809 слов на основе Cambridge English Corpus (273 млн слов). Свободное использование для образовательных целей.
  • NAWL v1.2 — те же авторы. 963 академических слова. Свободное использование для образовательных целей.
  • COCA (Corpus of Contemporary American English) и BNC (British National Corpus) — для оценки частотности слов, которых нет в NGSL.

Оставьте первый комментарий. Начните обсуждение

Поставьте ползунок в зелёную зону