Pipeline, скрипты, quality gates и runbook для волн ресерча.
1. Назначение и границы
Входит: верификация производителей (B2B ~$200k и ОПТ), каталоги по нишам × регионам, скоринг, master-dedup, pro/public, веб-каталог.
Не входит:04_рынки_и_спрос/ (аналитика), longlist в 05_ресerch_USA_P1/ до отбора, юр. гарантии по сертификатам (перед PO — factory audit).
Корень базы: база_заводов_китай/
2. Архитектура данных
Ресерч → CSV → quality → master/export → JSON → UI. Из веба в CSV данные не пишутся.
3. Два контура
B2B $200k+
ОПТ
Каталог
КАТАЛОГ/200k_заводы/
Каталог ОПТ/
Score
≥7 + tier A/B в вебе
≥6
JSON
catalog.json
catalog_opt.json
Фильтр
is_quality_factory()
is_quality_opt()
Лимит
10–12 / нишу, ≥3 tier A
max 70 / поднишу
B2B-веб (build_200k_web.py)
tier ∈ A, B · оценка_завод_10 ≥ 7
Нет trader-флагов · в сайт нет MIC/Alibaba/1688/Goldsupplier
4. Модель строки
ЗАВОДЫ.csv в папке ниши — source of truth после deep research.
Ключевые группы полей: идентификация (master_id), контакт, верификация (tier, уровень_проверки), сделка (MOQ, чек), рынки, описание.
_master/ЗАВОДЫ_мастер.csv — один завод = одна строка (~198 unique). Wave1+ добавляет новые домены в одну нишу, список: scripts/_existing_b2b_domains.txt.
5. Quality gates
B2B — b2b_200k_quality.py
full — enrich, reject → отклонённые.csv
audit — отчёт без перезаписи
market-upgrade — tiers, master
ОПТ — opt_quality.py
score_row() 0–10; ниже 6 — отсев. MAX_PER_CATEGORY = 70.
6. Справочник скриптов
Запуск из корня заводы/:
Скрипт
Когда
b2b_research_wave1.py
Новая B2B-волна
append_b2b_wave1.py
Merge в ЗАВОДЫ.csv
b2b_200k_quality.py
После правок CSV
export_tier.py
После market-upgrade
build_200k_web.py
Всегда после CSV
build_katalog_200k_by_niche.py --skip-csv
Только структура папок
append_verified_rows.py
После OPT waves
build_opt_katalog.py
Региональные ОПТ CSV
7. Runbook волны
Волна начинается с ресerch в интернете (Google, Baidu, сайты, 爱企查) — человек или агент с сетью. Только после записи в WAVE*_ROWS / verified/*.csv запускайте append и скрипты ниже — они сеть не используют.