Внутренний обзор · не для продажи
ЧТО МЫ СДЕЛАЛИ?
Конвейер верификации заводов Китая
Два независимых контура данных — B2B от $200k и массовый ОПТ —
четыре рынка (США, Европа, СНГ, GCC), единые quality gates и одна веб-витрина.
Зачем это нужно
Коротко: мы собираем заводы по правилам, а не «как получится» из поиска.
-
Раньше
Много ссылок с Alibaba и длинных списков без единых правил. Непонятно: это завод или перекупщик.
-
Сейчас
У каждого производителя — оценка, свой сайт, контакт. Сомнительные строки отсекаются до попадания в каталог.
-
Итог
В интерфейсе только проверенные заводы: крупный B2B (от ~$200k) и массовый опт — в одном месте, по категориям и рынкам.
Как проходит одна волна
Нажми кнопку — покажем на примере. Интернет не открываем.
01
Ниша
02
Поиск
03
Quality
04
CSV
05
Web
Здесь по шагам расскажем: что искали, что проверили, куда попало в каталог.
Это демо. Настоящая волна — человек или агент в интернете, потом скрипты.
Какие ресerch уже сделаны
Волны с логами запросов в репозитории. Полные таблицы «запрос → что нашли» — в КАК_ИСКАЛИ.md каждой волны.
Каналы поиска
| Контур |
Когда |
Где искали |
Результат |
Лог в репо |
Что такое волна
Волна — это когда мы идём в интернет и ищем заводы. Скрипты append и build_200k_web интернет не открывают — они только упаковывают уже найденное.
Интернет
Реальный ресerch (волна)
- Где
- Браузер или агент в чате с доступом к сети
- Что
- Google, Baidu, Yandex, 爱企查, официальные сайты заводов
- Результат
WAVE*_ROWS, verified/*.csv, КАК_ИСКАЛИ.md
волна заканчивается записью в файлы
Репозиторий
Упаковка (без сети)
- Где
- Папка
база_заводов_китай/, терминал
- Что
- append → quality → export →
build_200k_web.py