Data exchange – Wikipedia

В чем особенности бизнеса компании «Хедхантер». Где и на чем зарабатывает. Сколько стоит бизнес. Размер дивидендов. Угрозы для бизнеса.

Как это работает

Владелец сайта, который хочет монетизировать свой ресурс, но не хочет размещать баннеры или ссылки, устанавливает на веб-страницах специальный HTML-тег. С его помощью уточняется целевая аудитория сайта: что делали пользователи, какие действия совершали, что их интересовало. Если рекламодатель берет эти данные для таргетирования, владелец ресурса получает определенный доход. То есть, информация не продается, а как бы «сдается в аренду» и может использоваться многократно.

Сегодня множество людей нуждаются в использовании биржи данных, более известной как data exchange. Но, для того, чтобы разобраться в данном вопросе, мы вам расскажем, что это за биржа данных и для чего она нужна.
Итак, биржа данных , в дальнейшем data exchange, – это одна из специализированных бирж, которая предоставляет рядовому человеку (заказчику, покупающему рекламу) определенные данные, которые характеризуют посетителей. Такие данные могут в себя включать пол, возраст, хобби, географическое положение, место работы и т.д. Это дает возможность при составлении рекламного объявления, выбрать только ту группу людей, которая будет максимально целевая для ваших товар и услуг. Такие данные собираются ежедневно с миллионов сайтов, которые отображают интересы пользователя и структурируют их. Стоит отметить, что личные данные, такие как телефон, домашний адрес не доступны, доступно только местоположение, например Москва. Таким образом, подобные биржи данных позволяют привести на сайт рекламодателя наиболее заинтересованную аудиторию, которая будет максимально эффективна в продаже тех или иных услуг, а также платежеспособна. Это целевое использование общедоступных ресурсов, а также большая экономия времени и средств на рекламу. Использование уже сегодня таких видов баз данных является целесообразным и перспективным. В дальнейшем, планируется подобрать определенные сигналы, которые подбирали бы самостоятельно группы людей для предоставления им интересующих их услуг.

1. Выбор ограниченного количества профессиональных областей в рубрикаторе

Рекрутер ищет резюме по выборке, отмечает галочками интересующие области. Вы можете поставить три галочки, пользуйтесь этим! Многие кандидаты ставят одну, а иногда вообще не ту, которую надо. Результат: ваше резюме на дне базы, мало просмотров и мало приглашений.

Например, вы ищете вакансию в продажах ИТ-услуг. Вы можете выбрать два варианта в профессиональной области «Продажи»: Телекоммуникации, Сетевые решения и Решения по автоматизации бизнеса. Третью галочку можете поставить, выбрав «Продажи» в профессиональной области «Информационные технологии».

Владельцы бизнеса

Текущие владельцы «Хедхантера» решили зафиксировать прибыль и продать часть своей доли инвесторам на американской бирже. Покупая акции «Хедхантера», мы покупаем долю в кипрском холдинге.

На фондовом рынке торгуются американские депозитарные акции «Хедхантера», или ADS. Иностранные компании используют ADS, чтобы разместить свои акции на американской бирже. Одна ADS равна одной акции. Всего у компании 50 млн ADS.

 

Время собирать камни

Российская рекрутинговая компания HeadHunter Group (HH Group) объявила о достижении договоренности о приобретении у Hearst Shkulev Digital Regional Network B.V. за сумму 3,5 млрд руб. 100% доли бизнеса ООО «Зарплата.ру», в управлении которого находится онлайн-платформа Zarplata.ru для поиска работы и найма персонала.

Согласно официальному заявлению HH Group, закрытие сделки по поглощению «Зарплата.ру», которая уже одобрена Федеральной антимонопольной службой (ФАС), планируется до конца января 2021 г.

Приобретение платформы Zarplata.ru призвано ускорить развитие бизнеса HeadHunter в стратегических направлениях – таких как проникновение в российские регионы, улучшенный охват аудитории «синих воротничков» и клиентов малого и среднего бизнеса», говорится в заявлении HH.

Для HeadHunter покупка бизнеса «Зарплата.ру» станет третьей и самой крупной сделкой на рынке онлайн-рекрутинга – после приобретения компании Job.ru в 2018 г. и 25% доли сервиса Skillaz в 2019 г.

Ссылки[править | править код]

  • MSDN: Dynamic Data Exchange
ПО

Это

заготовка статьи

о

программном обеспечении

. Вы можете помочь проекту, дополнив её.

Ссылки на источники
В этой статье не хватает ссылок на источники информации.

Информация должна быть

проверяема

, иначе она может быть поставлена под сомнение и удалена.

Вы можете

отредактировать

эту статью, добавив ссылки на

авторитетные источники

.

Эта отметка установлена

7 июля 2014 года

.

Какие данные мы анализируем и откуда они берутся

Мы анализируем access-логи и любые кастомные логи, которые пишем сами.

 

95.108.213.12 — – [13/Aug/2018:04:00:02 +0300] 200 «GET /employer/2574971 HTTP/1.1» 12012 “-” «Mozilla/5.0 (compatible; YandexBot/3.0; +http://yandex.com/bots)» “-” «gardabani.headhunter.ge» «0.063» “-” «1534122002.858» “-” «192.168.2.38:1500» “[0.064]” {15341220027959c8c01c51a6e01b682f} 200 https 1 — “-” — – [35827][0.000 0]
178.23.230.16 — – [13/Aug/2018:04:00:02 +0300] 200 «GET /vacancy/24266672 HTTP/1.1» 24229 «hh.ru/vacancy/24007186?query=bmw» «Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_5) AppleWebKit/603.3.8 (KHTML, like Gecko) Version/10.1.2 Safari/603.3.8» “-” «hh.ru» «0.210» «last_visit=1534111115966::1534121915966; hhrole=anonymous; regions=1; tmr_detect=0%7C1534121918520; total_searches=3; unique_banner_user=1534121429.273825242076558» «1534122002.859» “-” «192.168.2.239:1500» “[0.208]” {1534122002649b7eef2e901d8c9c0469} 200 https 1 — “-” — – [35927][0.001 0]

В нашей архитектуре каждый сервис пишет логи локально, а затем через самописный клиент-сервер логи (в том числе и access-логи nginx) собираются на центральное хранилище (далее logging). К этой машине имеют доступ разработчики и могут вручную грепать логи при необходимости. Но как же в разумное время погрепать несколько сотен гигабайт логов? Конечно, залить их в hadoop!

 

Откуда данные появляются в hadoop?

В hadoop хранятся не только логи сервисов, но и выгрузка prod-базы. Ежедневно в hadoop мы выгружаем некоторую часть таблиц, которые необходимы для аналитики.

 

Логи сервисов попадают в hadoop тремя путями.

 

  1. Путь в лоб — с хранилища логов ночью запускается cron, и rsync выгружает сырые логи в hdfs.
  2. Путь модный — логи с сервисов льются не только в общее хранилище, но и в kafka, откуда их вычитывает flume, делает предобработку и сохраняет в hdfs.
  3. Путь старомодный — во времена до kafka мы написали свой сервис, который читает сырые логи с хранилища, делает из предобработку и заливает в hdfs.

Рассмотрим каждый подход более подробно.

 

Путь в лоб

Крон запускает обычный bash-скрипт.

#!/bin/bashLOGGING_DATE_PATH_PART=$(date -d yesterday +%Y/%m/%d)HADOOP_DATE_PATH_PART=$(date -d yesterday +year=%Y/month=%m/day=%d)ls /logging/java/${LOGGING_DATE_PATH_PART}/hh-banner-sync/banner-versions*.log | while read source_filename; dodest_filename=$(basename “$source_filename”)/usr/bin/rsync –no-relative –no-implied-dirs –bwlimit=12288 ${source_filename} rsync://hadoop2.hhnet.ru/hdfs-raw/banner-versions/${HADOOP_DATE_PATH_PART}/${dest_filename};done

Как мы помним, в хранилище логов все логи лежат в виде обычных файлов, структура папок примерно такая: /logging/java/2018/08/10/{service_name}/*.log

 

Hadoop хранит свои файлы примерно в такой же структуре папок hdfs-raw/banner-versions/year=2018/month=08/day=10

year,month,day мы используем в качестве партиций.

 

Таким образом, нам надо только сформировать правильные пути (строки 3–4), а затем выбрать все нужные логи (строка 6) и с помощью rsync залить их в hadoop (строка 8).

Плюсы этого подхода:

  • Быстрая разработка
  • Все прозрачно и понятно

Минусы:

  • Нет предобработки

 

Путь модный

Поскольку мы заливаем логи в хранилище самописным скриптом, то логично было прикрутить возможность лить их не только на сервер, но и в kafka.

Плюсы

  • Онлайн-логи (логи в hadoop появляются по мере заливки в kafka)
  • Можно делать предобработку
  • Хорошо держит нагрузку и можно заливать большие логи

Минусы

  • Сложнее настройка
  • Надо писать код
  • Больше составных частей процесса заливки
  • Сложнее мониторинг и разбор инцидентов

 

Путь старомодный

Отличается от модного только отсутствием kafka. Поэтому наследует все минусы и только некоторые плюсы предыдущего подхода. Отдельный сервис (ustats-uploader) на java периодически читает нужные файлы, делает их предобработку и заливает в hadoop.

Плюсы

  • Можно делать предобработку

Минусы

  • Сложнее настройка
  • Надо писать код

И вот данные попали в hadoop и готовы к анализу. Давайте немного остановимся и вспомним, что же такое hadoop и почему на нем можно погрепать сотни гигабайт гораздо быстрее, чем обычным grep.

 

Hadoop

Hadoop — это распределенное хранилище данных. Данные не лежат на каком-то отдельном сервере, а распределены между несколькими машинами, а так же хранятся не в одном экземпляре, а в нескольких — это сделано для обеспечения надежности. Основа скорости обработки данных лежит в изменении подхода в сравнении с обычными базами данных.

 

В случае обычной БД мы извлекаем данные из нее и отправляем клиенту, который делает какой-то анализ и возвращает аналитику результат. Таким образом, чтобы быстрее считать нам надо иметь много клиентов и параллелить запросы (к примеру, поделить данные по месяцам — и каждый клиент может считать данные за свой месяц).

 

В hadoop все наоборот. Мы отправляем код (что именно мы хотим посчитать) к данным, и этот код выполняется на кластере. Как мы знаем, данные лежат на многих машинах, таким образом, каждая машина выполняет код только над своими данными и возвращает результат клиенту.

 

Многие, наверное, слышали о

map-reduce

, но писать код для аналитики не очень удобно и быстро, в то время как писать на SQL гораздо проще. Поэтому появились сервисы, которые умеют превращать SQL в map-reduce прозрачно для пользователя, причем аналитик может и не подозревать, как на самом деле считается его запрос.

 

В hh.ru для этого мы используем hive и presto. Hive был первым, но мы постепенно переходим на presto, т. к. он гораздо быстрее для наших запросов. В качестве GUI мы используем hue и zeppelin.

 

Мне удобнее считать аналитику на python в jupyter, это позволяет считать ее одним кликом и на выходе получать правильно оформленные excel-таблицы, что сильно экономит время. Пишите в комментариях, эта тема тянет на отдельную статью.

 

Вернемся к самой аналитике.

 

Single-domain data exchange[edit]

In some domains, a few dozen different source and target schema (proprietary data formats) may exist. An “exchange” or “interchange format” is often developed for a single domain, and then necessary routines (mappings) are written to (indirectly) transform/translate each and every source schema to each and every target schema by using the interchange format as an intermediate step.[2] That requires a lot less work than writing and debugging the hundreds of different routines that would be required to directly translate each and every source schema directly to each and every target schema.

Examples of these transformative interchange formats include:

  • Standard Interchange Format for geospatial data;[3]
  • Data Interchange Format for spreadsheet data;[4]
  • Open Document Format for spreadsheets, charts, presentations and word processing documents;[5]
  • GPS eXchange Format or Keyhole Markup Language for describing GPS data;[6][7] and
  • GDSII for integrated circuit layout.[8]

Динамика популярности – Data exchange hh что это

Google Тренды это диаграмма для отслеживания сезонности ключевых слов. Этот график позволяет лучше понять сезонное изменение полулярности запросов по определенной тематике.

Значения приведены относительно максимума, который принят за 100. Чтобы увидеть более подробную информацию о количестве запросов в определенный момент времени, наведите указатель на график.

Где зарабатывают

Кипрскому холдингу принадлежат акции в локальных подразделениях, которым, в свою очередь, принадлежат права на сайты, бренд и базу данных в конкретной стране. Ключевой актив — российское подразделение, которому принадлежит HH.ru. Он приносит 93% выручки. Холдингу принадлежит 100% в подразделении.

Остальные подразделения, которые работают в Беларуси, Казахстане и Азербайджане, совокупно приносят оставшиеся 7% выручки. Холдингу принадлежит от 50 до 66% акций.

4. Отклик на все вакансии в компании-мечте

Рекрутеру также видны все отклики: старые, новые, на какие вакансии в рамках компании. Если вы откликнулись на все сразу – и на секретаря, и на менеджера, и на руководителя, то вывод напрашивается один: вам все равно, какая вакансия. Привлекать внимание к себе таким образом нельзя, вы рискуете получить пометку «откликается на все подряд».

На чем зарабатывают

«Хедхантер» зарабатывает на работодателях и соискателях через собственный сайт. У компании четыре услуги. Подробнее о них — чуть ниже. Но нужно учитывать, что в конце 2017 года «Хедхантер» приобрел Job.ru. Рост некоторых показателей в 2018 году к предыдущему году слишком большой из-за присоединения.

Подписка на пакет услуг. Работодатель покупает подписку и получает доступ к базе резюме и возможность публиковать вакансии. Подписки есть на разный срок — от одного дня до года. Пакетный сегмент растет медленнее, чем две входящие в него услуги по отдельности: 25% против более 33% роста к предыдущему году. В проспекте заявляется о включенной дополнительной ценности для клиентов в пакетном предложении, но, кажется, она не такая большая, раз все больше клиентов выбирают отдельные услуги.

Руководство видит рост своих доходов в росте расходов компаний на услуги в интернете. На 2016 год всего 10% предприятий России использовали онлайн-платформу для подбора персонала. Для сравнения: аналогичный показатель в Австралии — 30%, в Германии — 25%.

В компании считают, что цены на услуги не такие высокие по сравнению с конкурентами — есть куда расти. Тоже возможность для роста дохода.

Публикация объявлений о работе. Работодатель может опубликовать свои вакансии на сайте на срок до 30 дней. Размер оплаты зависит от количества опубликованных вакансий. Треть вакансий из Москвы, Санкт-Петербурга и их областей.

Доступ к базе резюме. Треть резюме — опять Москва, Санкт-Петербург и их области. Две трети — «белые воротнички». 50% людей, опубликовавших резюме, откликалось на вакансию. Компания заявляет, что 70% резюме проходит проверку с помощью искусственного интеллекта — это позволяет не тратить деньги на черновую работу.

Больше половины резюме — рабочие профессии. Здесь руководство тоже видит потенциал роста: для этого покупали Job.ru и его базу. Чтобы привлечь аудиторию рабочих, будут использовать рекламу на телевидении и в газетах.

Руководство ориентируется на то, что население будет стареть и наступит дефицит кадров. Из-за этого расходы на привлечение новых сотрудников вырастут.

База данных резюме в миллионах штук

Показатель 2015 2016 2017 2018
Резюме 19,2 23,0 27,4 36,2
Рост год к году Нет данных 20% 19% 32%

Дополнительные услуги для соискателей. За плату «Хедхантер» поднимет резюме в списке для работодателей, поможет с резюме, проконсультирует по вопросам карьеры. Осталось научиться делать что-то полезное ? Еще компании принадлежит сайт Career.ru для студентов и выпускников. Он приносит меньше 10% резюме. На сайте зарабатывают за счет баннерной рекламы.

Клиенты

Компания выделяет три сегмента клиентов: ключевые, малые и средние, остальные. Ключевые клиенты подписаны на базу резюме минимум 180 дней и могут публиковать до десяти вакансий. Малые и средние клиенты — те, кто не подходит под описание ключевых. Остальные — иностранные клиенты и клиенты дочерних компаний.

Большая часть доходов с клиентов — за счет Москвы, Санкт-Петербурга и их областей: количество клиентов и средний чек там больше. Руководство видит драйвер роста в работодателях из регионов: предприятия могут расти, интернет — распространяться, бюджеты компаний на онлайн-рекламу вакансий — увеличиваться.

Доходы «Хедхантера» не зависят от нескольких клиентов: десять крупнейших клиентов принесли суммарно 1,6% дохода. Поэтому потеря крупнейших клиентов «Хедхантеру» не страшна.

 

See also[edit]

  • Atom (file format)
  • Lightweight markup language
  • RSS

5. Отсутствие контактных данных и имени

Если вы боитесь, что вас вычислит текущий работодатель или вас начнут доставать звонками с неинтересными предложениями, настройте резюме так, чтобы его видели только те, кому вы откликнулись сами.

Но если вы открыто ищете новую работы, не усложняйте себе и рекрутеру жизнь, пишите все контакты сразу. В таком случае шанс, что рекрутер с вами свяжется, выше.

hh_3

Копирование и любая переработка материалов с сайта neohr.ru запрещены

Рейтинг
( 1 оценка, среднее 5 из 5 )
Загрузка ...