Как собрать базу ЛПР из Telegram-чатов: парсинг, фильтрация, сегментация
Пошаговая инструкция: как найти лиц, принимающих решения, в Telegram-чатах. Парсинг участников, фильтрация по нише и роли, автоматическое определение ЛПР, экспорт в CSV.
Проблема: тысячи людей в чатах, но как найти тех, кто принимает решения?
Вы знаете, что ваши клиенты сидят в Telegram. Чаты «SaaS Founders CIS», «Продуктовый маркетинг», «B2B Sales Russia» — в каждом от 500 до 5 000 участников. Суммарно: десятки тысяч потенциальных контактов.
Но вам не нужны все. Вам нужны ЛПР — founders, CEO, head of sales, директора по маркетингу. Те, кто реально принимает решение о покупке.
Ручной отбор — это ад: открыть профиль, прочитать био, понять нишу, записать в таблицу. При 50 профилях в час вы потратите неделю на один чат. И это без учёта того, что половина участников — боты, студенты и «коучи по успеху».
Шаг 1. Парсинг: собрать всё из чата за минуты
Парсер Sell_Agent работает с публичными Telegram-чатами и каналами. Вы указываете ссылку — система собирает:
- Участников — юзернеймы, имена, биографии
- Сообщения — тексты, даты, метрики (просмотры, пересылки, ответы)
- Медиа-информацию — наличие вложений, хэштеги
Парсинг идёт в фоновом режиме. Асинхронные задачи обрабатываются через очередь — вы можете запустить парсинг 10 чатов одновременно и заниматься другими делами.
Масштаб: до 1 000 000 сообщений на бизнес-тарифе. Батчи по 5 000 сообщений со стримингом — память сервера не переполняется даже на огромных чатах.
Шаг 2. Автоматическое определение ниши
Парсер — это не просто «выгрузить юзернеймы». Система автоматически классифицирует каждый контакт по нише.
15 ниш определяются автоматически:
- crypto, SaaS, ecom, dev, marketing, beauty, finance, real_estate, education, healthcare, legal, HR, logistics — и ещё 2 категории
Определение работает через два слоя:
Regex-паттерны — 100+ шаблонов для русского и английского текста. «Маркетплейс», «селлер», «дропшиппинг» → ecom. «Коуч», «онлайн-школа», «вебинар» → infobiz. «Blockchain», «DeFi», «web3» → crypto.
LLM-анализ — для сложных случаев система отправляет батч из 50+ контактов на анализ языковой моделью. AI определяет отрасль, компанию, интересы, навыки.
Каждая классификация имеет confidence score от 0 до 1. Контакты с низкой уверенностью помечаются отдельно — вы решаете, включать их в выборку или нет.
Шаг 3. Определение роли — фильтр ЛПР
Ниша — это «где работает». Роль — это «кто принимает решения».
8 ролей определяются автоматически:
| Роль | Примеры паттернов |
|---|---|
| Owner | Основатель, владелец, собственник |
| C-level | CEO, CTO, CFO, генеральный директор, исполнительный директор |
| Director | Директор по маркетингу, вице-президент, зам директора |
| Manager | Менеджер, тимлид, продакт-менеджер, руководитель отдела |
| Specialist | Инженер, дизайнер, бухгалтер, юрист |
| Freelancer | Фрилансер, консультант, эксперт |
| Employee | Сотрудник без уточнения |
| Unknown | Нет данных для определения |
Для B2B outreach вас интересуют первые 4 уровня: owner, C-level, director, manager. Это и есть ваши ЛПР.
Фильтрация — один клик: убираете specialists, freelancers, employees. В базе остаются только те, кому имеет смысл писать.
Шаг 4. Фильтрация по ключевым словам
Ниша и роль — это автоматика. Но иногда нужна точная фильтрация под ваш продукт.
Поиск работает по:
- Био — текст в профиле участника
- Сообщениям — что человек писал в чатах
- Комбинации — и био, и сообщения одновременно
Регистр не важен. Поиск поддерживает несколько ключевых слов с логикой AND/OR. Работает через PostgreSQL с GIN-индексами — даже на базе из 100 000 контактов результат за секунды.
Пример: вы продаёте CRM для ритейла. Парсите чат «Ecom Russia». Фильтр: ниша = ecom, роль = owner OR manager, ключевое слово в сообщениях = «CRM» OR «автоматизация». Из 3 000 участников остаётся 120 целевых ЛПР.
Шаг 5. LLM-обогащение контактов
Для топовых контактов система запускает глубокий LLM-анализ. На выходе по каждому лиду:
- Должность — извлечённая из контекста, не только из био
- Отрасль и компания — если упоминались в сообщениях
- Buyer role — насколько вероятно, что человек принимает решения о покупке
- Интересы и навыки — для персонализации первого сообщения
- Lead score — предварительная оценка перспективности
- Рекомендованный подход — какой тип первого сообщения подойдёт
- Персональный хук — конкретная зацепка для начала диалога
Батчевый анализ: 50+ контактов за один запрос — экономия токенов и времени.
Шаг 6. Экспорт и запуск кампании
Два варианта использования готовой базы:
CSV-экспорт — стриминговая выгрузка до 50 000 записей. Колонки: ID сообщения, дата, юзернейм, имя, тип автора, био, текст, хэштеги, метрики. Батчи по 1 000 записей — даже большие выгрузки не зависают.
Прямой импорт в кампанию — контакты из парсера идут напрямую в outreach-кампанию Sell_Agent. Без промежуточных шагов: спарсил → отфильтровал → запустил AI-агента.
Почему не покупать готовую базу
Купленные базы — это:
- Устаревшие контакты (30–50% неактивны)
- Нулевой контекст — вы не знаете, о чём человек пишет
- Те же базы у конкурентов — людям уже написали 10 раз
- Сомнительная легальность
Парсинг публичных чатов — это:
- Актуальные контакты (человек был активен сегодня)
- Контекст активности — вы знаете, что его волнует
- Уникальная база — никто больше не парсил именно этот набор чатов с вашими фильтрами
- Публичные данные — человек сам опубликовал информацию в открытом чате
Весь процесс: от чата до кампании за 30 минут
- Укажите ссылки на целевые чаты → парсер собирает участников в фоне
- Отфильтруйте по нише и роли → автоматическая классификация уже готова
- Уточните по ключевым словам → точная выборка под ваш продукт
- Запустите LLM-обогащение → каждый контакт с рекомендованным подходом
- Импортируйте в кампанию → AI-агент начинает персонализированный outreach
Ручной сбор базы из 500 ЛПР: неделя работы менеджера. С парсером Sell_Agent: 30 минут, пока вы пьёте кофе.
Хотите попробовать парсер на своих целевых чатах? 14 дней бесплатно →