JPDB.io for dummies
JPDB.io - это не просто сайт с флешкарточками, но и полноценный словарь, с базой и сортировкой кандзи и выражениями, специально созданный для изучения японского языка. Это уже ставит его на уровень выше, чем большинство других сервисов. Он отслеживает все слова и кандзи, которые вы изучаете, что исключает дубликаты карточек, обеспечивают максимально ровный процесс обучения без лишнего запара. Примеры использования:
JPDBReader с подсвечиванием незнакомых слов и фуриганой для них:
Плагин для MPV плеера с майнингом по клику и подсмотром слов по наведению:
Преимущества
Отсутствие дубликатов слов.
Встроенная информация о распространенности слов
Учить кандзи или нет - ваш выбор. Все произношения каждого кандзи также отсортированы по распространенности.
Наличие аддона для браузера JPDB, позволяющего читать почти любой текст в браузере с комфортом.
Наличие плеера JPDB (Patreon), позволяющего делать карточки со скриншотами и аудио из любого контента имеющего субтитры, скачанного на ваше устройство.
Нет проблем с синхронизацией.
Можно сделать импорт из Anki.
Есть интеграция с Wani Kani
Недостатки
- Слабонастраиваемый.
- Некоторые полезные функции стоят за платежной стеной в 5 долларов\месяц, а Patreon не работает в России (Есть способы обхода).
- Нельзя добавлять свои картинки и к карточкам бесплатно.
- Невозможно заучивать слова, которые не находятся в базе сайта.
- Полностью на английском языке! Если вы не владеете английским на комфортном уровне, от использования данного сервисом лучше воздержаться, имхо.
- Не работает оффлайн.
в понятия
Заранее введу лексику, которая будет использована далее:
Ревью (Review) - то, зачем вы тут - этап просмотра накопившихся карточек
Карточка - одно слово (или выражение), а точнее один из его видов написания.
Повторение - любая оценка карточки при.
Колода (Deck) - группа карточек в коллекции.
Статусы карточек
Due - карточки которые ждут вас в ревью, чтобы вы их прошли.
Failed - карточки, которые вы оценили как Nothing или Something в последний раз.
Known карточки, которые вы правильно оценили и они должны будет появиться минимум через +- несколько недель
Learning - карточки которые еще вы не провалили, но еще не дошли до этапа Known(став Known, больше в Learningони не вернуться)
Blacklisted - черный лист, карточки из него не будут считаться при расчетах сайта вообще.
Already known - слова, которые не будут показываться в ревью, но будут считаться в вашей личной статистике как известные, но на доске лидеров не идут в учёт. Присваивается статус вручную.
Suspended - слова которые вы не хотите изучать, но будут считаться при расчетах. Присваивается статус вручную либо заранее определенным группам слов через настройки.
Locked - карточки, составные части которых в еще не знаете.
Разделы сайта:
Стартовая страница
Сразу видно поиск, любое слово можно искать каной, кандзи или на английском. Если вариантов несколько, они выдаются по степени их распространенности или близости с запросом.
Страница слова
Здесь вы видите всю нужную информацию о слове. Также, если вы вписываете слово на японском, права-сверху можно выбрать язык. Вам может быть полезен вариант JP с монолингвистическими определениями. Если нажать на троеточие, то будет вариант добавить слово самую первую колоду по приоритету у вас на странице колод в один клик. Это полезно, если вы хотите выучить конкретное слово. У меня для этого специально создана колода 「すぐに学ぶ」 куда я помещаю все слова, которые хочу учить немедленно.
Edit meanings - позволяет вам добавлять свои переводы. Туда можно, например, вводить русские переводы вручную.
Edit sentence - вы можете выбрать любое из датабазы, которое будет показываться при ревью, или же внести свое.
Edit image [P] - Можно только удалить картинку, если она была добавлена через плеер.
Edit audio [P]- Можно добавить или удалить свое аудио.
I don’t know this - Если вы хотите чтобы карточка стала “новой”
Также указаны прочие написания того же слова разделенные по распространенности (иногда даже версии с другими написаниями), использованные кандзи, произношение, питч.
Used:X позволяет посмотреть в каких произведениях из датабазы слово есть, а также распространенность среди разных корпусов.
Ниже показаны слова, в которых данное слово является компонентом
Learn
Страница о вас и для вас.
Words - количество слов у вас во всех колодах.
Kanji - количество кандзи у вас во всех словах в колодах. Карточки Кандзи на JPDB даются только только тогда, когда в колоды вы добавляете слова с кандзи, и они показываются при заучивании новых карточек перед тем, как вам должны показаться слова с этими кандзи. Карточки кандзи можно отключить в настройках (я настоятельно рекомендую это сделать).
Words (indirect) - indirect слово, это слово, которое является компонентом одного из слов, которое у вас в колодах. Например 日本語 состоит из "слов" 日本 и 語, но у вас в колодах только 日本語, то прежде, чем вы его изучите, вам дадутся слова 日本 и 語, хотя их нет в колодах. Этот функционал можно отключить (я имел его отключенным, потому что меня раздражало как это работает, и я в ручную добавлял компоненты, когда считал это нужным).
Kanji (indirect) - количество кандзи, которые являются компонентами кандзи, которые являются частью слов у вас во всех колода. "melting_face""melting_face""melting_face"
Learning - количество learning слов.
You know - количество всех "знакомых" карточек, тое есть Due, Failed, Known, Learning и Already known вместе.
Total known non-redundant vocabulary: "знакомые" слова, за исключением Redundant.
Start Reviewing - начать сессию карточек.
Далее идут (будут идти) ваши колоды, приоритет интуитивно меняется стрелками справа. Можно сразу создать колоду из вариантов ниже:
New Empty Deck - понятно.
New deck from text - вставляете любой текст, оно само посчитает все. Удобно, если есть, допустим, книжка в тексте, и вы хотите заранее подучить самые распространенные слова, которые в ней есть, или просто посмотреть сколько слов из нее вы знаете.
New Deck from top vocabulary - Можно делать колоды из корпусов JPDB по распространенности.
Подробнее
Здесь можно выставить диапазон редкости слов, но бесплатно лишь до топ 3.000, и до 30.000 для доноров. Но это можно обойти, попросив кого-то с подпиской сделать экспорт колоды. Также несколько вариантов будет приложено далее.
Filter by corpus [P] - можно выбрать, из каких корпусов будет высчитываться распространённость слов. Если вы хотите понимать больше аниме - стоит выставить только ани, т.д.
Filter by part of speech [P] - можно выбрать, по каким частям речи будет выбран корпус.
New Deck from database - перенесет вас в раздел Build-in-Decks куда внесено множество Аниме, ВН, ЛН и прочего. Там можно совершать поиск по разным параметрам, но все, на мой взгляд, очень интуитивно, объяснять особо нечего.
Import from Anki - можно перенести ваши колоды из Anki на сайт.
Подробнее
Это немного муторный процесс и не всегда успешный, к сожалению. Это многих отталкивает от перехода на этот сайт, но некоторые колоды я, например, просто продолжил делать в анки, а новые продолжил делать тут. Пометив слова как Already Known, либо можно запариться и потратить пару часов на то, чтобы в ручную снова отметить все слова как помните.
Вся подробна информация расписана на сайте, но основные положения:
Работает только на колоды, где есть поля с только 1 словом, на которое вы целились. Если оно ТОЛЬКО среди продолжения - остается вариант создавать новое поле и вносить в него каждое слово вручную.
Также, если в вашей колоде фуригана записана в формате ""日本[にほん]”, то слова не перенесутся, либо перенесутся криво. Тут есть два варианта, либо изменить названия полей (будет показано дольше, но не всегда работает, лучше попробовать сначала через них), либо можно избавиться от всех скобочек, выбрав нужные карточки (выбрать все в списке CTRL+A), нажать CTRL+ALT+F, ввести в поиск \[.*?\]
, поставить галочку “Treat input as regular expression” как на изображении 1 и нажать ок. Если скобки другие, измените квадратные на них.
Чтобы экспортировать колоду, на главном экране анки, справа от каждой колоды есть шестеренка, тыкаете её - экспорт. Советую убрать галочку “включить медиа”, ускорит процесс. Вы можете экспортировать сразу все коллекцию, но если у вас колоды разного формата, лучше переносить колоды по одной, чтобы чинить каждую по-отдельности, при необходимости.
ОСТОРОЖНО!
Не забудьте сделать копию колоды, прежде чем модифицировать её.
Если при загрузке произошла ошибка, и карточки либо не импортировались, либо импортировались без информации о прошлых ревью, то можно попробовать следующее:
В браузере карточек, выберете любую карточку из нужной колоды, нажмите Поля (Fields) и переименуйте поля, добавляя в них следующие параметры:
jpdb_vocabulary
– поле со словом (только слово или кандзи от него, без фуриганы)jpdb_reading
– поле с только чтением (хирагана\катакана)jpdb_furigana
– поля со словом и чтением (по идее можно не проворачивать шаг с удалением чтения выше, но у меня не получалось)jpdb_meaning
– значение (перевод)jpdb_ignore
– игнорировать (все прочие поля)
Пример:
Field | Contents |
---|---|
Слово | 死神 |
Чтение | しにがみ |
Фуригана | 死[しに] 神[がみ] |
Значение | Бог смерти |
Пример | 死神はりんごしか食べない |
Аудио | [sound:shinigami.mp3] |
Если все прошло успешно, то будет экран, как на картинке ниже, и нужно нажать Import Data. Если не что-то получается, то особо ничего не поделаешь.
Special decks - колоды которые присутствуют изначально у всех пользователей.
Страница колоды
Здесь видно сколько в колоде индивидуальных слов (Vocabulary) и какое у вас покрытие, если эта колода была сделана из списка слов или взята из датабазы. На примере колоды из базы по Neon Genesis Evangelion, видно что я имею 91% карт как Known (92% в скобках это количество изучаемых карт). А Coverage это часть слов, которые являются Known если считать каждое повторение слова. Разберем на примере:
私は彼が嫌いです。彼は私を好きです
слова в этих предложениях 私,は,が,彼,嫌い,好き,です. 8 штук, Но при этом всего слов 12. Если вы знаете только 2 слова, допустим は,です, то known vocabulary будет 25% (2 из 8)
私は彼が嫌いです。彼は私を好きです。
но coverage будет 33.3% (4 из 12)
Deck state override - можно присвоить статус всем карточкам в колоде. Часть доступна только с подпиской. Target coverage [P] - % покрытия, после которого новые карточки не будут браться из этой колоды, и приоритет уйдет колоде ниже. Learning order [P] - порядок появления новых карт. Local Frequency - среди выбранной колоды, Global - среди всего корпуса JPDB.
Built-in decks
Здесь можно искать контент по сложности, типу медиа и прочим характеристикам. Тут всё довольно интуитивно, замечу только одну деталь важную - сложность по JPDB учитывает только сложность лексики, а также очень сильную фору дает более коротким произведениям из-за того, как работает алгоритм, так что если вы ищете аниме или сериалы, выставляйте минимальное количество эпизодов, если ВН\ЛН - минимальное количество слов и т.д, чтобы он не показывал просто короткие работы.
Каждое произведение можно добавить как колоду, некоторые, например аниме, даже по сериям. Многие это используются для prelearning - но я настоятельно рекомендую не заниматься этим, если у вас есть возможность МАЙНИТЬ. Больше о майнинге будет далее.
Settings
Их довольно много, пройдемся по самым важным и не самым очевидным моментам.
Review Interval Length - нужно настроить под себя, но я бы советовал его подстроить так, чтобы ваш Retention в статистике был около 75-80%. Можно меньше, вы сэкономите немного времени, но ревью будут сложнее. Если больше - уже будет слишком много ревью.
Automatically reveal new cards - лучше иметь выключенной, чтобы если попадались новые слова, чтение и смысл которых в "угадали" или уже знали, можно было сразу отмечать их "Okay"
Maximum new cards per day - называется немного ложно, по факту оно просто дает уведомление при достижении цели и можно продолжить учить после "максимума"
Tech me subvocab - как я и писал, если вас будет раздражать поведение сабвокаба на сайте, можно выключить.
Blacklist particles - лучше выключить и отмечать частицы в процессе их изучения. Они очень сильно влияют на реальный coverage, и когда они в блеклисте он занижен.
Blacklist katakana names \ loanwords - я предпочитаю выключить, мало ли, что-то будет незнакомое.
Suspend words outside of a given top most common words [P] - полезно, если вы не хотите пока что учить слишком редкие слова. Например, пока у вас вокаб лишь 2к, лучше не учить слова выше топ10к, и сюда можно вписать 100000
Vocabulary card customization (front)
Автопроигрывание аудио - выкл, предложение - вкл, показывать чтения неизвестных слов - вкл, скрывать предложение - по желанию. Вообще, на предложение смотреть в 90%+ случае не надо, это мешает учебному процессу и строит запоминание через ассоциации которых не будет в реальном контексте, но это не подходят для многой ономатопеи или для слов с одинаковым написанием, и иметь предложение заблюреным - просто лень каждый раз тыкать. Картинку - выкл, чтение - выкл, "do not confuse" - вкл
Vocabulary card customization (back)
все вкл.
Example sentences configuration
все вкл.
Pick bilingual sentence only if it’s i+1 - i+1 это предложения, где неизвестно только одно слово. Мне кажется, он в приоритете, нежели чем предложение, где куча неизвестных слов, но есть перевод. Но на ваше усмотрение.
Kanji learning configuration
Я настоятельно рекомендую выключить карточки с кандзи. Учить кандзи в изоляции от слов - бесполезный практически навык, который требует очень много усилий. Хотя бы попробуйте учить без них, и если вам не понравится - верните обратно. Не повторяйте ошибку многих, не учите кандзи. Подробнее об этом в основном моём гайде для начинающих.
Data export - нужно для некоторых сторонних приложений.
Account information - API нужен будет для некоторых сторонних приложений.
JPDB LABS [P]
Ссылка на этот раздел находится внизу экрана на главной странице сайта. Тут куча разных плюх, но ничего полезного особо. Посмотрите что есть полезного для вас.
Experimental settings
SRS Scheduling module - все советуют включить экспериментальный, и это правильно. Он считает сложность слов в зависимости от того, как слова учатся другими пользователями, что полезно для отсеивания особо сложных или особо легких слов. А также в общем, он более эффективный чем стандартный. Я советую Поставить интервал на более длинный, чем стандартный, но экспериментируйте.
Ревью
Можно приступить к изучению слов. Эта часть будет очень субъективной, так что судите для себя. Это то, как я делаю оцениваю карточки.
Лицевая сторона
На лицевой стороне вы просто пытаетесь вспомнить слово. Не перевод, а что оно значит, это важно. Мы (в основном) не стремимся стать переводчиками, мы хотим понимать и говорить на японском, а не переводить его у себя в голове. Если вы понимаете, при какой ситуации это слово используется - отлично. Не нужно мучить себя и подбирать русский или английский аналог. Можете подглядывать в пример, на учитывайте это при оценивании. Я позволяю подсмотреть в пример только если совсем не могу вспомнить слово само по себе или если оно того требует.
Также очень важно не тратить много времени на лицевую сторону, да и на заднюю тоже. Желательно смотреть на переднюю карточку не более 6-8 секунд (для отображения таймера есть скрипт, об этом внизу страницы). Также не нужно пытаться запомнить несколько значений слова. Вы не сможете выучить ВСЁ через флешкарточки, не нужно пытаться выучить всё.
Обратная сторона
Пришедших с анки, где тыкают только 2 кнопки, аж 5 (+2 скрытые) может очень пугать, но это лишь на ваше благо.
Как оцениваю я:
- Nothing - я не могу вспомнить\неправильно вспомнил и произношение, и чтение.
- Something - вспомнил что-то одно правильно.
- Hard - вспомнил и произношение, и значение, но с подсказкой в виде контекста, либо я иногда кидаю сюда слова, у которых перепутал один звук\произношение одного из Кандзи перепутав с другим. Иногда просто противные слова сюда кидаю.
- Okay - то, к чему мы стремимся, вспомнил все правильно.
- Easy - только для очень легких слов, и то, только в начале. Допустим вы уже выучили 自動販売機, но упустили 販売機 сам по себе. В таком случае, я бы не помечал это слово как I'll never forget, а просто отмечу его как easy.
- Blacklist - отправить его в блеклист. Обычно я кидаю туда слова и особенно выражения, которые слишком очевидные или легкие или бредовые.
- I'll never forget - отметить как известное, но чтобы больше его не видеть в ревью. Я не советую особо сюда тыкать, тем более эти слова не будут считаться на доске лидеров.
Новые карточки
Вот тут появляется одна из самых больших проблем JPDB по-моему скромному мнению. Парсинг не идеален. Некоторые слова типа 子供達 в базе находятся как отельные слова. Та же проблема со множественным суффиксом ら, Уважительными приставками お、ご и также встречается куча очевидных выражений как отдельные (да, кроме слов, тут также встречаются выражения, словосочетания). Подобные случаи я всегда отправляю в Blacklist, чтобы они не считались системой за слова.
JPDBReader
Данное бесплатное расширение, которое в коммьюнити называется "Breader", позволяет очень удобно майнить почти любой текст, выделять разные типы слов разными цветами, автоматически показывать фуригану у разных типов слов. Бесконечно удобное расширение.
Установка
Скачиваете последнюю версию расширения на этом гитхабе
Как устанавливать неофициальные расширения можно прочитать тут. При распаковке архива, осознанно выберете место, где будет хранится расширение, чтобы его не потерять.
Настройка
- General - вставляете свой API токен, он находится самом низу настроек JPDB
- Mining deck ID - айди колоды, в которую будут создаваться карточки. Чтобы найти его, просто откройте нужную колоду на сайте и посмотрите в адресную строку. Просто впишите цифру
- Add to FORQ when mining - делает так, что слова будут ставится первыми по приоритету изучения новых карт, независимо от приоритета колоды.
- Keybinds - выставите все удобное под себя. Как минимум Show Popup нужно как-то отметить, мне удобнее всего на боковую кнопку мыши. Работает похоже на йомичан.
- Appearance Custom Word CSS - можно настроить под себя, вся информация детальная содержится на гитхабе в readme. Но я бы советовал данные настройки. Слова не в колодах - голубые, новые в колодах - синие, заблокированные - синие, учащиеся - зеленоватые, в ожидании ревью - оранжевые, заваленные - красные. Фуригана только над неизвестными словами.
.jpdb-word { color: inherit; } .jpdb-word.not-in-deck { color: rgb(126, 173, 255); } .jpdb-word.new { color: rgb(75, 141, 255); } .jpdb-word.locked { color: rgb(75, 141, 255); } .jpdb-word.learning { color: rgb(66, 201, 93); } .jpdb-word.due{ color: orange; } .jpdb-word.failed { color: red; } .jpdb-word:is(.never-forget, .known, .due, .failed, .redundant, .blacklisted) .jpdb-furi { display: none; }
Обязательно сохраните изменения, и на всякий случай сделайте экспорт настроек.
Использование
На некоторых сайтах парсинг происходит автоматически, это:
- ッツ Reader на мой взгляд лучший ридер для японского.
- Страницы хукеров текста: anacreondjt.gitlab.io/texthooker.html, learnjapanese.moe/texthooker.html которые зачастую используют для вставления текста из буфера обмена при, например, игры в визуальные новеллы.
- Mokuro: Если путь файла содержит
mokuro
и файл заканчивается на.html
- Wikipedia JP
- Readwok
Также, нажав на значок расширения сверху в браузере, и можно выбрать вкладку, которая пропарсится полностью. Либо при выделении текста и ПКМ, тыкаете на кнопку расширения как на картинке.
Новые слова, которые вы хотите изучать, можно добавлять 2 способами:
- Просто помечаете слова как nothing и они сразу же появятся у вас в очереди на ревью
- Создавайте свои карточки с контекстом! Расширение само выделит предложение вокруг слова, и вы вручную можете добавить перевод, через, но мне кажется не стоит париться с переводом. Тут же вы можете сразу пометить слово в какой-то из степени вашего его знания.
Также слова можно отмечать как известные вместо ревью на сайте. Некоторые экспортят слова и делают ревью частично через Breader специально. Также можно уменьшать интервалы в настройках на время чтения, чтобы отмечать больше слов, сокращая потенциальное время ревью.
JPDB MPV Extension [P]
Лучшее я оставил под конец. Это расширение просто невероятно удобно, и ничто даже не стоит близко по плавности и простоте использования. Вся нужна информация есть снизу Labs
Сразу понятно становится, почему это очень удобно. Два клика - карточка готова, при минимуме настройки и проблем. И моментально подсматривать слова тоже очень удобно.
Установка
Пробовал только Windows, но с другими системами проблем быть не должно.
- следуйте гайду по MPV до части про майнинг.
- снизу Labs скачиваете нужную вам версию, запускаете и устанавливаете.
ОСТОРОЖНО!
Ни в коем случае не делитесь скачанным расширением, оно настроено только под ваш аккаунт.
Плеер должен работать. Настройки сверху справа, подстройте под себя. Не стоит делать все типы слов разными цветами, я советую сделать отдельным цветом только новые, может быть Due и Failed.
Майнинг происходит двойным кликом по слову. Не майните более одного слова за раз, просто не будет майниться.
Сторонние скрипты и бонусы
Скрипты нуждаются в расширении типа Tampermonkey, они будут помечены [scr]
Сайт с расширенной статистикой, сюда нужно загружать экспорт данных из настроек.
@luizbafilho’s Grammar Tag Userscript[scr] - отмечает грамматику. Информация взята с itazuraneko.
@Calonca’s Percentage Bar[scr] - показывает сколько слов осталось и какую часть из всего количества вы сделали.
@ジャイ’s jpdb-export[scr] - позволяет экспортировать колоды, которые потом можно импортировать через "Import from Shirabe Jisho"
@Max’s Review Countdown[scr] - можно сделать таймер для ревью. Настройка в самом скрипте.
Time Zone Changing script позволяет изменить часовой пояс. Изначально он сохраняется от часов, которые были на вашем устройстве при регистрации. Скрипт нужно вставить в консоль в браузере. Час считается так:
0 = UTC 0:00
.60 - UTC 1:00
. Если вы хотите смену дня в5:00 UTC+3:00
, нужно поставить(3 - 5) * 60 = -120
Вставить число нужно в консоль разработчика в браузере.
(async (offset) => { try { const resp = await fetch("https://jpdb.io/set-timezone", { method: "POST", credentials: "include", headers: { "content-type": "application/x-www-form-urlencoded" }, body:
offset=${offset} }); if (resp.ok) console.log("Successfully changed timezone"); else console.log(
Error ${resp.status}: ${await resp.text()}); } catch (e) { console.log("Network Error:"); console.error(e); } })(YOUR_OFFSET_HERE)
@daruko’s Context Menu Script добавляет троеточие, которое на странице слова, на страницу ревью.
Всегда больше помощи и инфы можно найти на JPDB Discord сервере