Операторам Казахстана разрешили строить 4G/LTE

До сих пор в Казахстане услуги LTE монопольно представляла компания Алтел. 



Об этом событии сегодня сообщает Profit.kz со ссылкой на пресс-службу КСИИ МИР РК. Новые частоты операторам государство пока что предоставлять или продавать не торопится. Все, что им разрешили, это рефарминг имеющихся частот и использование вновь полученных, когда/если операторы их получат.

К сожалению, в краткой публикации нет подробностей, в частности, с какого момента операторы имеют право начать оказание услуг.

Что же, в любом случае, это позитивная новость для рынка Казахстана. Теперь на рынке восстанавливается конкурентная ситуация, Билайн и KCell вновь получают возможность вести конкурентную борьбу на поле перспективных технологий.

+ +

Рост курса валюты не увеличит расходы Билайна на аренду

Когда в начале нулевых годов Билайн заключал договоры, номинированные в валюте, это было обычной практикой. Поэтому контракт на аренду здания по адресу Краснопролетарская ул. д.6, (бизнес-центр Эрмитаж Плаза, он же бывший завод ТИЗприбор) был номинирован в валюте. 



Цены на связь были еще сравнительно высокими, расходы на поддержание сети не столь заметными, курс рубля управлялся государством, инфляцию держали в узде. Поэтому некоторый рост рублевых расходов от года к году на аренду здания на Садовой особо никого не напрягал. В 2014 году, как известно, был введен "свободно плавающий" обменный курс, а также началась череда известных событий в жизни нашей страны, которые вместе с падением цен на нефть, быстро раздули выплаты по договору.


В достоверности картинки не уверен, поскольку не нашел ее источник,
к тому же она отражает ситуацию только на август 2015 года,
с тех пор курс рубля еще снизился.

Миром с арендодателем договориться не удалось, поэтому Вымпелком обратился в суд, требуя обязать арендодателя согласовать изменений в договоре в части оплаты стоимости аренды, зафиксировав оплату в диапазоне от 30 до 42 рублей за доллар за квадратный метр. Напомню, стоимость доллара уже превышает 73 рубля. Компания ссылалась на существенное изменение политики ЦБ РФ, отказавшегося от применявшихся ранее механизмов регулирования курса. Как сообщают сегодня Ведомости со ссылкой на ТАСС, Арбитражный суд принял решение в пользу Вымпелкома.

Следует отметить, что решение может оказаться прецедентным. У операторов, в частности, сохранились номинированные в валюте договора на аренду площадок, где установлено оборудование сотовой сети. Их операторы теперь тоже, вполне возможно, попробуют пересмотреть.

Некоторые юристы высказывают удивление решением суда, указывая на то, что теперь можно обращаться в суд для пересмотра всех договоров, номинированных в валюте, заключенных между российскими юрлицами. В том числе, договора валютной ипотеки. Что может создать большие проблемы для банковской системы и в целом привести к существенным последствиям для страны.

Так или иначе, но если у операторов получится пересмотреть договоры с другими российскими юрлицами, зафиксировав в них курс валюты, это поможет стабилизировать операционные расходы, растущие последнее время из-за обесценивания рубля по-отношению к мировым валютам.

+ +

LTE в Архангельске глазами Минкомсвязи

О представительности драйв-тестов я уже не раз отзывался. Как и о том, что они дают лишь очень примерную картину, которая далеко не всегда обеспечивает пользователям объективную картину, полезную для выбора оператора. Взглянем на данные, которые приводит на своем сайте Минкомсвязи РФ для Архангельска.

МегаФон, как известно, приступил к оказанию услуг LTE в Архангельске еще в декабре 2013 года. А с августа оператор начал предлагать там также услуги Yota. Покрытие сети LTE, судя по карте Минкомсвязи, далеко от идеального, но все же LTE-услугу оператора нетрудно встретить в городе.


МТС начала выходить в Архангельскую область почти годом позднее - в июне 2014 года сообщалост о запуске сети в Северодвинске, в апреле 2015 года - в Котласе. В Архангельске пока LTE от МТС выглядит следующим образом. 


В целом карты "оценки качества связи" выглядят несколько странно. Интенсивность цвета  кружков, иногда сливающихся в линии, привязана к каким-то "полоскам", которых может быть от одной до четырех. (Мне казалось, что всё, что надо знать о полосках - это одна или две, а о радиопокрытии сотовой сети обычно судят по уровню сигнала в dbm или схожих единицах). А вот что это за кружки на карте? Скорее всего, это место, где был проведен замер. А что происходит с окрестностями изолированного кружка - там не было замеров или нет услуги? Поверить в то, что услуга пропадает уже в нескольких шагах от центра точки, куда бы от нее не сдвинуться, я не могу. Значит, по соседству исследования просто не проводились. Но "точечные" карты практически не позволяют составить целостную картину покрытия LTE в городе! И действительно, сравним эти "замеры" с тем, что обещают операторы на своих теоретических картах покрытия.

Это "МегаФон"



Это МТС 

В общем, я не очень понимаю, как можно использовать ресурс Минкомсвязи в практических целях. Если цель - не введение абонентов в заблуждение, конечно. Как, впрочем, вызывает у меня большие сомнение и сплошная заливка на карте МегаФона. 

+ +

Неназванный чиновниками оператор запустил услуги 3G/LTE в Симферополе

Удивительную новость выпустило сегодня Минкомсвязь России. В тексте официального сообщения говорится о запуске сетей стандартов 3G и LTE в Симферополе и Симферопольском районе, Крым. При этом не говорится, какой же из операторов запустил и эксплуатирует эти сети. Удивительно, но факт.

Карта Крыма, 1920 год

Скорее всего, речь идет все о том же К-Телеком, который в Крыму заменяет "большую четверку". Во всяком случае ранее сообщалось о планах "модернизации" сети этой компании в Симферополе.

Сообщается, что запущено 110 базовых станций. Что это значит, мне не очень ясно - то ли каждая из баз поддерживает и 3G и LTE, то ли это всего 55 сайтов, на каждом из которых - по базе 3G и LTE. То ли зоны покрытия сетей 3G и LTE совсем не идентичны, и лишь малая часть сайтов поддерживает LTE (прим АБ: b7 2.5-2.7 ГГц).

Скорее всего, верной является последняя гипотеза. Из сообщения чиновников можно узнать, что всего в Крыму действует всего 60 BS LTE и это с учетом того, что считается, что LTE есть в Севастополе, Керчи, Ялте (8 баз) и на "популярных курортах ЮБК".

Все же забавно, что название оператора скромно опущено. Видимо, в безальтернативной ситуации все должны знать о какой сети идет речь. Кстати, обещают, что в начале 2016 года операторов станет 3 разных.

Конец "самостоятельного" проекта Yota уже не за горами?

Многих взбудоражила публикация высказывания Алишера Усманова, который "проговорился" о планах объединения МегаФона и Yota в ближайшие "пару лет". Новость активно обсуждается, причем есть, как те, кто безусловно верит в такое развитие событий, так и те, кто считает, что это маловероятный сценарий.


Аргументы "за"

- Люди типа Алишера Усманова не "ляпают" в интервью то, что они не хотят увидеть опубликованным. Так что решение по слиянию скорее всего принято акционерами. При этом, вовсе не обязательно оно было доведено до сведения руководителей и, тем более, пресс-служб МегаФона/Yota.

- Yota изрядно каннибализировала абонбазу МегаФона. Косвенно это подтверждается тем, что в салонах МегаФон как правило нельзя приобрести подключение к Yota (разве что модем с подключением купить).

- Yota была нужна, прежде всего, как держатель лицензии и частот. Которые МегаФон, как известно, смог получить в обход аукционов и конкурсов, неконкуретным путем. Благо и ФАС, и прокуратура, и другие ведомства не нашли в себе сил воспрепятствовать безобразию под названием "йотагейт". Частоты легализованы, используются МегаФон, а теперь после разрешения на "частотный шеринг" надобность в сохранении Yota заметно снизилось.


Аргументы "против"

- Компания нашла своего клиента. Пусть это и нишевый сегмент, но сообщается о 1.5 млн клиентов. В эту цифру я, конечно, не верю, но по-крайней мере - это достаточно заметная цифра по-сравнению с тем, чего добивались операторы "большой тройки", запуская свои суббренды или MVNO. Да, в этих 1.5 млн клиентов заметная доля - это экс-клиенты МегаФона, но встречаются там и экс-клиенты других компаний Б3. А значит, в целом тандем "МегаФон с Yota" наращивает "кредитную" часть баланса подключений.

- Пресс-служба Yota пытается рассказывать, что Усманова не так поняли.


Это, конечно, тот самый случай, когда хвост пытается рассказывать, что собака не то имела в виду.

Мнение

Мавр сделал свое дело, мавр может уходить. Не раз уже говорил и повторюсь - МегаФон не будет долго терпеть сложившуюся ситуацию. Бренд долго искуственно удерживали на плаву, но поскольку за "йотагейт" в теущих условиях МегаФону ничего не грозит, а Yota не особенно полезна и генерит различные издержки, от которых вполне можно избавиться, поглотив этот "бузинесс", то такое поглощение - это наиболее вероятный сценарий. Так что ждем. Горизонт событий - скорее всего 2016 год, может быть затянется до 2017. Возможно тариф с названием Yota проживет дольше, но уже в рамках МегаФона.

Это мнение разделяют и другие, например


А что думаете вы?

+ +



Экспресс-АМУ1 - запущен еще один закупленный у Франции спутник

Российские "внебюджетные средства" освоены французской компанией Airbus Defence. Заказчиком выступила ГПКС в рамках Федеральной космической программы России на 2006-2015 годы. Финансирование осуществлялось с использованием кредитных ресурсов, привлеченных в Газпромбанк. 


Запуск осуществлялся с казахстанского космодрома Байконур, ракетой-носителем Протон-М с разгонным блоком Бриз-М. Запуск прошел успешно, и сейчас специалисты Airbus Defence управляют выводом космического аппарата на геостационарную орбиту. По завершении этого процесса, а также тестирования спутника, управление передадут специалистам ФГУП Космическая связь.

Спутник оборудован транспондерами Ku- и Ka- диапазонов, он будет стоять в позиции 36 ВД. В зоне действия - европейская часть РФ, а также Африка южнее Сахары. Планируемый срок службы аппарата - 15 лет. Ожидаемый ввод в эксплуатацию - февраль 2016 года. 

Всего у ГКПС на орбите 12 космических аппаратов, АМУ1  после запуска в эксплуатацию станет тринадцатым. 

+ +

Не спрашивайте меня, почему аппарат закупили именно у Франции,  а не, например, у Канады. Про импортзамещение и поддержку отечественного производителя тоже давайте грустно промолчим. 

Российский рынок телекоммуникаций: предварительные итоги 2015

«ТМТ Консалтинг» подготовил отчет «Российский рынок телекоммуникаций 2015-2020». Привожу его текст для вас - это предварительные итоги развития отрасли связи в 2015 году. 

По предварительным данным «ТМТ Консалтинг», объем рынка телекоммуникаций в 2015 году достиг 1674 млрд руб. Темпы роста доходов составили 2,1%, что несколько выше динамики предыдущего года (1,7%).

Причинами небольшого увеличения динамики рынка стал значительный рост доходов от услуг платного ТВ, а также эффект от изменения курса иностранной валюты при расчетах за ряд межоператорских услуг, оказываемых на международных направлениях.

Структура сегментов телеком рынка



и динамика изменений на рынке 


Традиционный драйвер рынка, сегмент мобильной связи, формирующий свыше половины доходов отрасли, впервые за многие годы продемонстрировал рост ниже, чем рынок в целом, а также ниже, чем годом ранее (1,2% в 2015 году против 1,9% в 2014 году). Хотя с точки зрения увеличения числа абонентов 2015 год должен стать рекордным за последние 5 лет – размер абонбазы увеличится на 10 млн., все крупные операторы продемонстрировали снижение ARPU.

ARPU федеральных мобильных операторов РФ, руб. 



Продолжается снижение темпов роста и в сегменте широкополосного доступа в интернет. При проникновении 53% на конец 2015 года рынок насыщен не только в крупных, но и в большинстве средних городов. Как следствие, за год число частных пользователей выросло лишь на 3%, практически на столько же увеличились доходы. Рост ARPU от услуги затруднен в условиях высокой конкуренции, а также в связи с тенденцией к пакетированию услуг (интернет+ТВ и интернет+ТВ+телефония). Обеспечивая операторам рост доходности от одного абонента и повышая его лояльность, абонент платит фактически меньше за каждую из составляющих пакета, чем если бы он приобретал их по отдельности.

В сегменте платного ТВ проникновение на конец 2015 года еще выше – 71%. Рост числа пользователей, соответственно, был также невелик – менее 4%, в то время как годом ранее он составил почти 9%. Однако в доходах рынок вырос за год на 21%. Столь значительный рост был связан с тем, что в начале года большинство операторов, чтобы компенсировать растущие расходы на закупку контента, подключение и обслуживание абонентов, вынуждены были пойти на повышение тарифов. Как следствие, средний счет на одного абонента увеличился за год в среднем по рынку на 14% до 151 руб.

Как и в предыдущие периоды, в 2015 году продолжилось падение доходов во всех подсегментах фиксированной телефонной связи, что связано с уходом трафика в мобильные сети и ОТТ-сервисы. За год от услуг телефонной связи отказались 1,8 млн абонентов. Хотя на смену традиционной телефонии приходят новые сервисы, в обозримом будущем эта услуга продолжит существовать: по прогнозам «ТМТ Консалтинг», ее проникновение снизится с текущих 45% до 34% в 2020 году.

В последующие 5 лет «ТМТ Консалтинг» прогнозирует снижение темпов роста российского рынка телекоммуникаций. Среднегодовая динамика в 2015-2020 гг. (CAGR) составит 1,3%. Как в фиксированной, так и в мобильной связи рост доходов от доступа в интернет и других услуг компенсируется падением доходов от голосовой связи, трафик которой перетекает в преимущественно бесплатные ОТТ сервисы. Можно ожидать, что новый прорыв на телекоммуникационном рынке будет связан с технологией 5G, однако ее коммерческое внедрение ожидается после 2020 года.

Тем не менее, существует ряд подсегментов телекоммуникационного рынка, которые будут демонстрировать высокие показатели роста в ближайшие 5 лет. Крупнейшие из них включают: 

- Рынок мобильного интернет-доступа
- Рынок М2М
- Рынок SMS-рассылок
- Рынок услуг CDN
- Рынок ОТТ ТВ-сервисы
- Прочие ОТТ-сервисы, реализуемые на фиксированных и мобильных сетях

Кроме того, операторы связи продолжают осваивать не включаемые в телекоммуникационный рынок ИТ-услуги, наиболее перспективные из которых – услуги дата-центров и облачные сервисы. 

Также перспективными являются услуги на базе больших данных (big data), однако это направление еще не сформировалось как рынок, и по крайней мере в ближайшие 2 года возможности больших данных будут преимущественно использоваться для решения внутренних задач операторов связи.

За дополнительной информацией обращайтесь: Константин Анкилов, управляющий партнер ТМТ Консалтинг тел.: +7 (495) 740-9880  e-mail: info@tmt-consulting.ru  

+ + 

МТС запустила собственный месседжер МТС Connect

МТС сегодня запустила сервис МТС Connect


Сервис МТС Connect позволяте осуществлять передачу коротких сообщений, включая отображение статуса и групповые часты, пересылать файлы, а также, например, информацию о местонахождении.

Решение построено на базе IMS / RCS. Что позволяет МТС плавненько двигаться к all-IP сетям и расширять число услуг на основе этих платформ. Включая VoLTE, например.

Важно отметить, что теперь возможны вызовы в любом публичном WI-Fi с использованием телефонного номера абонента. Это удобно прежде всего потому, что появляется возможность звонков на любые мобильные, городские, МГ/МН номера, как будто вы звоните из обычной сети, а не из Wi-Fi. Конечно, это не бесплатно, будет тарификация по условиям действующего тарифного плана и опций. Здесь выигрыш для тех, кто еще умудряется попадать за границу - для них входящие и исходящие в зоне публичного Wi-Fi будут тарифициароваться по ценам вызовов в домашнем регионе.

И, конечно, должны порадоваться те, у кого дома Wi-Fi качственный, а вот покрытие сети МТС -  так себе. Для них по ценам ничего не поменяется, а вот качество голоса существенно вырастет. Впрочем, кое для кого может быть и поменяется - абонентам тарифов Smarts МТС при использовании МТС Connect оператор удваивает количество доступных минут. Пока без скрытых платежей.

Еще вызовы как правило быстрее устанавливаются - тоже профит.

В общем, хорошая попытка, посмотрим, что скажет массовый пользователь.
Пока что отзывы... разные. Говорят, что проблемы с двухсимочниками, с активацеий, кому-то не нравится качество голоса, у кого-то повышенный drop rate. Надеюсь, что это трудности роста, что большинство проблем можно будет порешать в ближайшем будущем. Вероятно с этим связано, что компания пока не спешит афишировать запуск.



Источник: "Мультифон, МТС Коннект ... кто следующий?"


Из первых рук. Мартин Шкоп - о развитии сетей компании в Москве

Мартин Шкоп, исполнительный вице-президент Билайн - о развитии сетей компании в Московском регионе в 2015 году.



Абсолютных цифр, увы, нет, но сообщает, что продолжали стройку. Причем это касается и Москвы и области, в значительной степени области, и LTE и 3G.
А еще Мартин говорит то по-английски, то по-русски.
Итак, что у Билайна в регионе:
Двухдиапазонная сеть 4G (800 МГц, 2600 МГц)
- Количество базовых станций 4G в 2015 году увеличилось на 15%
- LTE-трафик в сети увеличился год к году в 3 раза
- Количество клиентов, использующих 4G устройства выросло в 3 раза
Что улучшили:
- Стабильность соединения и среднюю пользовательскую скорость 
- В Красногорске, Химках, Долгопрудном, Лобне, Мытищах, Королёве, Пушкино, Ивантеевке, Балашихе, Реутове, Железнодорожном, Серпухове, Одинцово, Зеленограде, Солнечногорске, Клину, Электростали, Ногинске, Павловский Посаде, Орехово-Зуеве, Коломне она составила выше 20 Мбит/с
- Покрытие сети 4G в коттеджных поселках, базах отдыха и санаториях по самым популярным у москвичей направлениям: Ленинградскому, Ново-Рижскому и Рублёво-Успенскому
В 2015 году продолжалась работа по развитию сети 3G. Дополнительные базовые станции были построены в большинстве крупных населенных пунктов Московской области, таких как: Ивантеевка, Дмитров, пос. Московский, Беляниново, Щербинка, Немчиновка, в парке ВСРФ Патриот, а также в районах Москвы - Северное Тушино и Богородское.
Для улучшения качества передачи речи на сети 3G Билайн активирована работа технологии HD Voice.

+ + 

Ooredoo Qatar и Nokia Networks разогнали LTE до 375 Мбит/с

Такие пиковые скорости поддерживаются на коммерческой сети LTE-A 3CA Cat.9 - в существенных частях столицы Катара (Doha). Агрегированы три полосы частот общим размером в 50 МГц в диапазонах b7 2.5-2.7 ГГц 20 МГц, b3 1800 МГц 20 МГц и b20 800 МГц 10 МГц.  


Использованы коммерческие базовые станции Flexy Multiradio 10. В октябре 2015 года компании Ooredoo и Nokia Networks также показывали агрегацию трех полос частот по 20 МГц с поддержкой скоростей до 600 Мбит/с (590 Мбит/с) для устройств Cat.11. Использовалось кодирование 256QAM. 

Покрытие LTE-A 3CA 450 Мбит/с доступно клиентам компании в West Bay, Corniche, Katara Cultural Village. 

Поддержка пиковых скоростей до 450 Мбит/с - это пока что, скорее, экзотика и маркетинг, нежели реальные требования рынка. С другой стороны, в развертывание поддержки агергации 3CA 256QAM инвестируют более, чем в 11 странах. В тестовом режиме такую агрегацию показывали, в частности, МегаФон и Ericsson в России. Это далеко не предел, например эмиратская du уже показывала и 900 Мбит/с в режиме 3CA MIMO4x4. Тесты агрегации трех полос частот 3CA_3-7-20 показывали Билайн в Москве и МТС в Уфе. 

++

Зарядник на топливных элементах начнут продавать в Эмиратах

myFC подписала эксклюзивный договор на продвижение своего зарядника JAQ на топливных элементах с неназванным телекоммуникационным оператором в ОАЭ. Продажи начнутся в 2q2016. 


"Зарядные карточки"


Это уже второй из известных мне эксклюзивных контрактов - другой заключен с 3, Швеция. 

Интересно, в России найдется оператор, который захочет соответствующее эксклюзивное соглашение заключить? 

Или не интересный гаджет? Вы бы себе такой купили? 

+ + 

Конспекты: Сергей Марин, Билайн. "Персональный менеджер и другие воплощения Big Data в Билайн"

Сергей Марин, руководитель службы разработки продуктов Big Data компании Билайн, "Персональный менеджер и другие воплощения Big Data в Билайн". 


Представляю вашему вниманию конспект выступления г-на Марина на встрече "Фестиваль данных, который прошел в рамках выставки высоких технологий SMIT при поддержке "Билайн" и "Школы данных Билайн" 2015.12.19.



Сергей Марин: В этом году Gartner в своем исследовании Hype Cycle, где они показывают тренды технологий, исчезла Big Data. Многие об этом говорили. По-сути, аналитики Gartner официально заявили, что Big Data больше нет.

Наша точка зрения такова. Big Data - это некий маркетинговый термин. Понятно, что не потому, что данные стали объемные, стало все замечательно. Данных стало много, это так, но важнее то, что данные появились везде - в телематике, в медицине, в рекламе. Тренд, независомо от того, называем ли мы его Big Data или нет, состоит в том, умеем ли мы эти данные собирать и обрабатывать. В приниципе, речь идет об анализе данных. Но Big Data звучит "круче", чем "анализ данных", поэтому все предпочитают использовать понятие Big Data.

Конечно, есть классы задач, где используются действительно большие объемы данных. Тем не менее, это все то же развитие идей машинного обучения.




То, чем мы занимаемся в Билайне - это в большинстве случаев анализ Big Data. Поскольку анализируемых данных действительно много. Абонентская база - более 50 млн абонентов. По каждому абоненту есть целый набор анализируемых параметров. Если все объединить, получается петабайт информации, которую нам предстоит обрабатывать.

Зачем мы вообще этим занимаемся?  Сейчас это уже вполне очевидно, а вот пару лет назад действительно такой вопрос возникал. Это настоящее "золото", которым компания располагает и которое поддается монетизации. Под монетизацией я понимаю, например, возможность разработать какой-то продукт, который будет привлекателен для клиента, предложить его таргетированному клиенту. Это из серии - клиенту хорошо и нам хорошо.

Важно, что речь идет не только об анализе собственных (внутренних) данных компании. Нам интересно анализировать также внешние данные.

Начнем с нас. Для чего мы используем анализ данных?


Основной вид использования анализа собственных данных компании - это "персональный менеджер". Зная уникальные потребности клиента, повышаем качество обслуживания лично для него, предлагая услуги, которые нужны именно этому клиенту.

Почему это Big Data? Потому, что мы знаем многое о каждом клиенте. Некоторые вещи с задержкой в пару секунд, иногда с задержкой до 15 минут. Фактически, на любое событие с клиентом можем реагировать. Например, клиент приехал в аэропорт, клиент подключил смартфон, клиент вернулся из роуминга. Есть понятие "клиентского пути", который проходит клиент в течение всего цикла пользования нашими услугами.


Если система установила, что клиент направляется за границу, ему уместно предложить подключение услуги роуминга.  Если он, напротив, вернулся из-за границы, стоит ему напомнить, что имеет смысл отключить какие-то опции, которые теперь стали ненужными.

Если клиент приобрел смартфон, ему можно предложить подключить мобильный интернет.

Это простые задачки, здесь не требуется использование механизмов типа "машинного обучения". Просто триггерная активность, которая, тем не менее, делается в реальном времени на большом объеме данных.

При таком подходе нужно стремиться к предельному виду персонализации.

Другая тема - наши семейные тарифы линейки ВСЁ! Здесь вопрос в том, как эти семьи отыскать? Это решаемая задача. Это так называемая графовая задача.

Какие еще интересные направления есть в аналитике данных в Билайн?

Управление оттоком. Тема не новая. Иногда это машинное обучение на обучающей выборке. У нас есть выборка клиентов, которые ушли. Можно ретроспективно изучить их на предмет корреляции между собой и, выявив такие корреляции, проверить базу для того, чтобы спрогнозировать, чей уход следует ожидать. Здесь тоже Big Data - если раньше было порядка 50 параметров, описывающих клиента, то сейчас зачастую - это около тысячи параметров.

Колл-центры. Здесь также предсказания очень важны и их можно генерировать. Как правило, перед тем, как происходит какой-то звонок от клиента в колл-центр, у клиента происходит какое-то "событие". Это может быть, например, обрыв связи и невозможность ее установить. Если мы наблюдаем, что между таким событием и звонками в колл-центр есть корреляция, то можно выделить группу клиентов "собирающихся звонить" в колл-центр. Уместно таким клиентам разослать превентивно SMS, в который проинформировать, что компания в курсе аварии, что меры принимаются, назвать прогнозное время восстановления услуги, извиниться. На выходе получаем существенное снижение нагрузки на контактный центр.

Про геоаналитику еще поговорим, это очень важное, интересное направление.

Управление фродом. Возможно не все знают, что такое "фрод" по-отношению к оператору связи. На самом деле, компания от этого страдает, поскольку есть "нехорошие люди", которые покупают SIM-карты и начинают через них быстро прогонять огромный объем трафика. Не буду рассказывать, по понятным причинам, как это организовано. Важно, что мы должны уметь очень быстро ловить такие события, чтобы оперативно предпринимать соответствующие действия. Поскольку если не среагировать быстро, никакой борьбы с фродерами не получится, поскольку карта очень быстро изымается из обращения.  Мы умеем быстро замечать и реагировать.


Есть одна тема, интересная наверное всем, кто интересуется темой Big Data. Это "графовые модели".

Мы проанализировали данные компании для проверки известной "теории шести рукопожатий". У нас получилось, что любой клиент Билайн связан с любым другим клиентом Билайн всего через 4 "рукопожатия".

У нас есть задача, связанная с так называемым "внутренним оттоком". Это ситация, когда клиент приходит в офис продаж или к агенту, и ему продают новую SIM-ку с новым номером. Как известно, не все люди чувствительны к смене телефонного номера, зато многие чувствительны к тому, что могут получить новый, более выгодный тариф.  Почему это делает агент? Потому что у него план продажи новых номеров, у него комиссия за такие продажи, ему нужно делать план. Чем это плохо для компании? Тем, что она платит агенту эту комиссию по-сути за уже имевшегося клиента.

Соответственно, такого клиента нужно найти. А агенту сказать, что у вас реальные продажи - 30%, а остальные 70% - это не то, что требуется. Каким "боком" здесь графовая модель участвует? Таким, что мы анализируем профиль звонков нового клиента на предмет корреляции с профилями звонков старых клиентов. И если они статистически совпадают, мы делаем обоснованное предположение о том, что это один человек. Далее считаем общее  количество и вычисляем процент внутреннего оттока в продажах.

Близкая тема - это мультидевайсы. Сейчас у многих две SIM-карты. Понятно, что если складывать абонентские базы "большой четверки", даже без региональных операторов, то получаем больше населения России. Очевидно, что у большинства людей более 1 SIM-карты. Как считать не в SIM-картах, а в людях? Эту задачу приходится решать всем операторам сотовой связи. SIM-карты считать легко, они "светятся" в биллинге. Задача также решается, как графовая, по профилю звонков.




Геоаналитика. Одна из очевидных задач оператора в области Big Data. Но при этом вовсе не тривиальная. Одни люди даже не думают, что это вообще возможно. Другие уверены, что пока у них в кармане лежит сотовый телефон, их местоположение известно с высокой точностью. Между тем, если, например, телефон старый, то о местоположении абонента известно только то, в каком секторе сети сотовой связи он находится. На выходе в этом случае данные с точностью 300-500 метров удаления от антенны в треугольнике с углом раскрыва 120 градусов. Причем данные о местоположении обновляются не в реальном времени, а, в основном, по факту каких-то действий - вы отправили SMS, приняли SMS, получили вызов, сделали вызов...

Ситуация со смартфонами чуть иная, они еще периодически в интернет выходят. Еще лучше смартфоны 4G/LTE, где на уровне протокола предусмотрена возможность постоянного съема геоданных.

В целом задача трудная, но интересная. Приходится прогнозировать положение абонента, поскольку она не известно нам в точности.

Зачем это нужно? Для выбора местоположения офисов розничных продаж. Они должны размещаться там, где есть существенный трафик абонентов компании. То же и в отношении развития сети - местоположение базовых станций должно выбираться с учетом потенциального спроса клиентов на трафик в данной точке.

И, конечно, анонимизированные данные могут быть использованы, например, в целях планирования развития города. Почему планирование города - это актуально?


Картинка, конечно, шутливая. Но если реально смотреть на вещи... Есть перепись населения, которая проводится достаточно редко. И есть такой город, как Москва, в котором вы представляете, как динамично все меняется. Поэтому статистические данные очень часто значительно отличаются от реальных.

Если мы захотим еще глубже сегментировать. На "проживающее население", "работающее население" и т.п.



Например, нужно посчитать, какой процент населения каждый день покидает заданный район. Это реальная задача. Важно, чтобы район покидал процент населения, не выше, чем ХХ, поскольку если будет выше, то имеющаяся дорожная инфраструктура не будет справляться. Понятно, что уже во многих районах не справляется. Спрашивается, как отслеживать этот процент? Можно, конечно, на транспортных магистралях поставить счетчиков, которые будут считать машины... что-то не очень это делают, вероятно, это достаточно дорого и не слишком точно.

Поэтому геоаналитика операторов сотовой связи сейчас очень востребована госструктурами, которые на ее основе планируют развитие города.

Мы с этого в свое время начинали пару лет назад. Тогда еще не зная, как это делать, какие данные нужно собирать. Сейчас значительно продвинулись, есть стандартные отчеты, которые мы предоставляем для использования госструктурами. А также используем в собственной деятельности.

Вернемся к тому, как именно мы делаем аналитику данных.


У нас есть большой набор данных, поступающих с различных систем. Они складываются в большой кластер Hadoop. У нас есть традиционное хранение в Oracle, но все новые Big Data мы складываем в Hadoop. Поверх работает аналитика. Она двух типов. Графоаналитика больших данных, а неграфовая - это, скорее, small data, когда берется некая "обучающая выборка" (small data) на основе которой с помощью методов машинного обучения строится компьютерная модель. И затем эту модель распространяем на весь кластер. По факту, на работу со Small data уходит больше времени, чем на работу с Big Data.

Стек используемых технологий - здесь нет ничего "революционного" для занимающихся темой Big Data.


Когда говорят о машинном обучении, на практике уже не особенно интересно, как именно это делается. Инструментарий вполне понятен. Куда интереснее вопрос о том, кто этим занимается. Кто такой этот современный Data Scientist?





Этих людей мало. Их мало где учат. И в основном они сконцентрированы не в бизнесе, а в научных заведениях. Разве что есть интернет-компании, как тот же Яндекс, где их сравнительно (относительно) много. В любом случае поиск таких людей - это отдельная задача. Не в последнюю очередь для решения этой задачи мы и запустили Школу данных.



Как я уже говорил, мы не хотим заниматься анализом только собственных данных. На картинке показано, как можно развивать направление анализа данных, объединяя собственные данные компании и внешние данные, которые можно получить. Это общая схема, по которой развиваемся не только мы, но и многие другие участники рынка Big Data.


Людям, занимающимся темой машинного обучения, это уже вполне ясно, другим, возможно, менее понятно. Очень часто встречающаяся задача - заказчик просит определить пол абонента на основе данных о телефонной активности абонента. Исходно задача кажется очень сложной - те паспортные данные, которые есть в базе, зачастую далеко не соответствуют реальному положению дел. Аппарат часто зарегистрирован на одного члена семьи, а пользуется им совсем другой человек. Особенно частой является эта ситуация тогда, когда телефоном пользуется ребенок. В итоге рассуждать о поле пользователя на основе только базы контрактов можно лишь с малой степенью достоверности.

Какие еще идеи могут возникнуть при решении задачи определения пола? Есть ли корреляция со средней продолжительностью вызовов, например? Заказчик, как правило, сам придумывает набор из нескольких параметров - до десятка. Далее мы должны с этими данными и идеями работать.  Это не лучший вариант.

Машинное обучение - это когда берется большой набор параметров, более сотни и с ними начинается работа с целью выявления корреляций. Выгружаются реальные данные. Строятся соответствующие модели. Это одна из задач моделирования, с которыми мы работаем.

+ +

Сессия вопросов и ответов

Q: Действительно ли маркетинг на основе Big Data компания использует в реальной деятельности, например, при выборе местоположения нового сайта?

СМ: В нашем случае этим занимается маркетинг совместно с техническим подразделением. Да, такое использование данных проводится.

Q: Продает ли Билайн данные, накопленные об абонентах? 

СМ: Наверное наиболее частый вопрос, который мне задают. Ответ простой - нет. Причин тому несколько, одна из них - запреты, содержащиеся в законодательстве. Но даже если бы это не регулировалось законом, это было бы невыгодно стратегически. Посудите сами, продав даннные один раз, мы становимся более ненужными. Нам выгоднее сотрудничать с заказчиками, предоставляя им какие-то синтетические результаты, а не первичные данные.

Q: Вы сотрудничали с Институтом Генплана Москвы. Какие данные они от вас получили?

СМ: Обезличенные данные о нагрузке на базовые станции в том или ином районе Москвы. Город у них разбит на квадраты, мы подсчитывали число абонентов в том или ином квадрате в различное время суток, например. Это те данные, которые доступны на уровне базовой станции, к персональным данным клиентов они отношения не имеют.

Q: Включаете ли вы в анализ данных анализ контента - речевой анализ вызовов, содержимое SMS? 

СМ: Нет.

Q: Исследуете ли вы собственные продукты, например, тариф "Семейный". Есть ли у продуктов выраженный срок жизни?

СМ: Под исследованием здесь понимается исследование срока жизни?
Такие исследования точно проводят в отделе марекетинга. Мы такими задачами напрямую не занимаемся. Однако мы участвуем в различных этапах этого срока жизни. Например, в начале создания продукта мы помогаем оценить размер целевой аудитории для подсчета бизнес-кейса, в момент запуска помогаем таргетировать предложение нового продукта, оцениваем эффективность коммуникации.

Q: Не опасаетесь, что точное попадание в интерес абонента с новыми персональными предложениями, будет вызывать у абонента опасения типа "за нами следят"? Или просто абонент посчитает оператора излишне назойливым?

СМ: Это две известные проблемы. Как сделать так, чтобы общение компании с абонентом, не выглядело спамом, и не выглядело взаимодействием с "большим братом". Первая проблема решается политикой контактов, принятой в компании. Эта политика жестко ограничивает частоту возможных контактов с клиентом по инициативе компании.

Вторая проблема - как не напугать клиента, чтобы у него не появились мысли, что оператор за ним как-то следит?

Я бы здесь сказал лучше про то, что мы используем данные о клиенте только для оказания ему услуг связи. Причем, повышая таким образом релевантность предложения подобных услуг. Например, если клиент приехал в аэропорт, то уместно ему предложить подключить ту или иную опцию роуминга - это в интересах клиента, это ему полезно.

+ +

TIM запустила VoLTE по всей стране

Оператор TIM, Италия запустил поддержку VoLTE по всей стране. Интересно, что оператор пока не стал вводить поддержку HD Voice, пообещав добавить данную функциональность позднее. 


Кроме того, оператор сообщил о расширении LTE-A на всю территорию страны. В 8 городах оператор обеспечит агрегацию трех полос частот, что дает ему возможность обеспечивать скорости передачи данных вплоть до 300 Мбит/с под брендом 4G Plus.

В июле 2015 года о запуске поддержки VoLTE в Италии заявил Vodafone. Оператор внедрил облачную реализацию услуги.

+ +




В МТС довольны итогами развития LTE в Кемеровской области

Оператор сообщает о росте активности абонентов в сети 4G/LTE в Кемеровской области.


Как известно, МТС предоставляет услуги LTE в Кемеровской области в рамках программы RAN sharing на базе сети Вымпелком. Начало оказания услуг - декабрь 2014 года. Тогда же начал предоставлять услуги LTE в области МегаФон, месяцем ранее - Вымпелком.

В зоне покрытия - Кемерово, Новокузнецк, Прокопьевск, Киселевск и аэропорт им. Леонова. LTE есть также в Шерегеше. По данным компании, в зоне охвата LTE - более половины населения Кузбасса. В 2015 году покрытие выросло на 20%.



МТС сообщает пару цифр, характеризующих картину пользования сетью. В среднем каждый "активный пользователь" 4G в Кузбассе скачивает в месяц 5 ГБ информации. Не знаю, что такое "активный пользователь", но это более, чем вдвое большее потребление, чем в среднем для российского пользователя LTE. Как правило, такие показатели можно наблюдать в регионах, где недостаточно проникновение фиксированного ШПД, но есть спрос на интернет-пользование.

Еще одна цифра из пресс-релиза - это "почти 3 ТБ" ежедневного потребления интернет-трафика в сети МТС в Кемеровской области. Если посчитать, что это 90 ТБ в месяц, то выходит, что при потреблении в 5 ГБ на абонента, число "активных пользователей" сетью LTE в Кемерово равняется порядка 18 тысяч.  Какую долю от общего числа абонентов это составляет, я могу только гадать, не зная числа абонентов МТС в Кемеровской области.
Если вспомнить, что в апреле 2015 года МТС сообщала, что трафик за период с декабря по конец марта составил более 150 ТБ. Это в среднем по 50 ТБ в месяц. Выходит, что трафик за прошедшие месяцы действительно вырос почти вдвое, что является хорошим результатом.

У Билайна, понятное дело, ситуация с покрытием идентичная



У МегаФона в Кузбассе с покрытием дело обстоит скромнее.


У Tele2 пока что нет LTE сетей в Кемеровской области.

+ +

Вам - минус рублик, а МегаФону - рост доходности

Услуги бывают разные. Какими пользоваться - решать абоненту. Какие тарифы на пользование услугой устанавливать - решать оператору. МегаФон, например, берет рублик (1 рубль РФ) за каждый случай, когда вам кто-то пытается дозвониться в момент, когда вы разговариваете по телефону. 



Это известные услуги "Ожидание/Удержание вызова". Чтобы не пропускать вызовы, случающиеся во время ваших разговоров по телефону. Услышав характерные звуки вызова в трубке, вы можете завершить разговор и переключиться на другой вызов, попросить вашего первого собеседника "повисеть на линии", поговорить со вторым и вернуться к первому. И так далее. Я и сам этой услугой, бывает, пользуюсь, хотя по телефону стараюсь говорить недолго и как можно реже.



Услуги Ожидание/Удержание предоставляют многие операторы. Практически во всех регионах, независимо от оператора, эти услуги предоставляются бесплатно. (Если вам известны иные примеры, поправьте меня пожалуйста.)  Но только не в С.Петербурге. Где на ряде массовых тарифов МегаФон посчитал необходимым взимать за каждый случай, когда вам кто-то звонит во время вашего общения по телефону, по рублику. Ну а что, вам ведь не жалко, а компании приятно. Курочка по зернышку клюет, как говорится... Ну и что, что другие операторы так не мелочатся. Может им деньги не нужны, а МегаФону очень нужны.

+ +

Квест. Загадочная картинка

Москвичам предлагается ребус.


Угадайте что за сеть и что готовится. 

+ + 

МТС и Ericsson сообщают о сотрудничестве в 5G в России

Тестирование МТС решений Ericsson 5G и сценариев использования этой технологии намечено на Чемпионат мира по футболу 2018. Совместные эксперименты начнутся уже в 2016 году. 



Можно вспомнить, что в ноябре МегаФон заявил о планах тестирования 5G решений Huawei также во время ЧМФ 2018.

Следует понимать, что речь пойдет о ранней стадии тестирования, поскольку коммерческое внедрение вряд ли состоится ранее 2020 года. Как ожидается, речь идет о приемопередающих устройства с небольшим радиусом действия, работающих в области СВЧ - от 5 ГГц и вплоть до многих десятков ГГц. В частности, в 2017 году компании планируют испытвать высокоскоростную передачу данных в диапазоне 15 ГГц.

В рамках совместной деятельности планируется тесное общение МТС и Ericsson с регулятором по вопросам использования частотного спектра для 5G. Как известно, соответствующие решения в России пока не принимались, как, впрочем, и в других странах.

LTE-U / LAA

Также МТС и Ericsson намерены реализовать в 2016 году пилотный проект LTE-U. Об этой технологии задействования нелицензируемого диапазона частот 5 ГГц, который сейчас используется устройствами Wi-Fi. Потенциально это обещает абонентам МТС дальнейший рост пиковых скоростей доступа к сети - вплоть до нескольких сотен Мбит/с при условии, что устройство абонента способно поддерживать работу в режиме LTE-U.

В мире пока что только один оператор решился на коммерциализацию данной технологии, но в 2016 году число "передовиков", возможно, вырастет. Хорошо, что и у российских операторов будет возможность оценить возможности новой технологии в ходе тестирования. Вряд ли МТС останется в одиночестве, насколько я знаю, планы в отношении LTE-U есть и у некоторых других российских компаний.

Lean Carrier

На сети МТС планируется также протестировать решение Ericsson Lean Carrier, оптимизирующее распределение сигнального трафика между сотами, снижающего взаимные помехи. Решение также упрощает планирование сети, его внедрение теоретически должно  улучшить покрытие и повысить скорость передачи данных.

M2M и IoT

Будут проведены пилотные тесты современных M2M решений, в частности, EC-GSM (Extended Coverage GSM), LTE-M (LTE Machine), NB-IoT (Narrow band IoT LTE based). Эти решения призваны помочь экономить использование частотного спектра устройствами M2M, улучшить покрытие сети для этих устройств, снизить энергопотребление и в перспективе удешевить "подключаемые устройства".

+ +

Ждем, что ответят на инициативы МТС и МегаФон операторы Билайн и Tele2. Вот только ведущих вендоров "железа" уже разобрали.

Tele2 официально объявила о запуске сети LTE в республике Адыгея

17 декабря 2015 года компания Tele2 выпустила пресс-релиз, сообщающий о запуске сети LTE в республике Адыгея.

Насколько я знаю, компания запустили в регионе сеть LTE 1800, но в пресс-релизе это не уточняется.

Никаких подробностей о сети компания не сообщает. Абонентам предложен стандартный расширенный набор пакетных тарифов: Черный, Очень черный, Самый черный и Сверхчерный, а также не менее стандартный набор опций: Пакет интернета, Портфель интернета, Чемодан интернета.

В регионе услугу LTE предоставляют теперь все операторы "большой четверки". Конкуренты Tele2 обеспечивают услугу в диапазоне b7 2.5-2.7 ГГц.

На карте оператора покрытие LTE в Майкопе и в целом в Адыгее еще не показано.


У Билайн обширное покрытие LTE в Адыгее, если судить по карте на сайте


Покрытие LTE МТС в Майкопе


Покрытие LTE МегаФон в Майкопе выглядит скромно.


+ +

Конспекты: Андрей Свирщевский, SAS Big Data Cases.

Представляю вашему вниманию конспект презентации Андрея Свирщевского, руководителя направления аналитики SAS Россия/СНГ по теме SAS Big Data Cases. Презентация состоялась на днях в рамках встречи, посвященной теме #BigData, которую проводило агентство Telecom Daily.

Рекомендую всем интересующимся темой Big Data.


Андрей Сврищевский: Представляю вашему вниманию несколько интересных проектов, которые мы осуществили в 2015 году. 


Основная группа проектов, которые сейчас существуют так или иначе связаны с тематикой получения дополнительной информации о конкретных юридических и физических лицах извне. Далее эта информация используется для  повышения эффективности процессов целевого маркетинга, управления рисками, сбора дебиторской задолженности и борьбы с мошенничеством.

Можно выделить два основных способа использования внешней информации. Первый способ - это повышение эффективности прогнозных моделей, которые уже сейчас используются в рамках этих процессов. Второй способ - за счет получения дополнительной информации о клиентах, становится понятно, кто же эти клиенты с социально-демографической и любой другой точки зрения. И на основе этого нашим заказчикам удается понимать, что же с этими клиентами делать. Т.е. решения принимают люди, на основе информации, собранной "математикой". Давайте посмотрим, как конкретно это делается.



Эффективность прогнозных моделей. В целевом маркетинге это, в первую очередь, различная аналитика, связанная с откликом клиентов. На основе систематизации наших проектов, можно заключить, что в этой области  основные внешние данные, которые пытаются использовать наши заказчики, это - социальные сети. Конкретные проекты показывают, что на десятки процентов удается повысить отклик клиента, если при принятии решения - что ему предлагать и что с ним делать, используются данные, добытые из социальных сетей. Это сегодня делают и крупные банки, и небольшие банки. 

Рост отклика в 6 раз - это если вообще не использовалась аналитика. А вот если использовать аналитику, но вдобавок еще и внешние данные задействовать, то на 76% у страховых компаний растет отклик. Наш опыт показывает, что у страховых компаний сложная ситуация - к ним клиент приходит обычно только раз в год. И хочет, скажем, заключать договор КАСКО. Для них использование внешних данных принципиально, т.к. позволяет существенно повысить эффективность работы. 

(Прим.АБ: Такие модели, в частности, используют Сбербанк и ПробизнесБанк. Точность моделей измеряется в LIFT - знакомо маркетологам. Исследуются в соцсетях такие интересы клиентов, как путешествия, экстрим, знание языков, виды развлечений, квартирный вопрос и т.п. Негативными факторами считается: религиозный фанатизм; выражение негатива к коллегам / работе; чрезмерное увлечение алкоголем; участие в митингах/демонстрациях.) 


Если говорить о принятии решений о выдаче кредитов, то опять же на десятки процентов повышается эффективность принятия решений - кому давать кредит, кому не давать. Здесь уже используются различные дополнительные источники данных. Например, если мы получаем доступ к поисковым запросам наших клиентов. Мы не можем получить запросы, которые клиент делает в Яндекс, но как правило можем получить его запросы в тех или иных интернет-магазинах, где клиент зарегистрирован. Разумеется не только на нашей сайте, но и на других сайтах. Сейчас подобная информация доступна. 

Анкетные данные также помогают, прежде всего, должность и работодатель. Например, если в должности человека системе удается найти ключевые слова, которые характеризуют его, как работника социальной сферы, например, он работает с детьми, то вероятность невозврата кредита существенно уменьшается. Соответственно система это учитывает при принятии решения о выдаче такому человеку кредита. 

В страховании все то же самое. Всегда есть доля клиентов, которым лучше вообще не выдавать полис КАСКО, поскольку это не имеет финансового смысла. 

Используя информацию соцсетей при работе с банковскими клиентами, нам не удалось пока что получить существенного выигрыша на том уровне, который мы получили при работе со страховыми клиентами. 


В плане борьбы с мошенничеством ситуация примерно та же. Общее повышение точности моделей на десятки процентов достигается за счет использования внешних данных.  Здесь это связано с тем, что мы в социальных сетях можем найти какие-то конкретные точечные характеристики. 

В целевом маркетинге, как правило, спектр интересов человека играет роль. В кредитном скоринге математика выискивают конкретные слова и словосочетания. В антифроде как правило ищут конкретные события, связанные с человеком.  Например, некоторые банки нас просят проставить рейтинг - в какой степени человек подвержен алкоголю. Понятно, что им не хочется иметь дело  с таким человеком. Или если человек такие поисковые запросы вбивал, которые дают понять, что ему интересно, как в плохой для него ситуации все же получить кредит. Если он это делал, то значит, что вероятность того, что ему стоит давать кредит, корректируется в сторону уменьшения. 

В кейсе показано, что даже модели не было у клиента, что решения принимались на основе собранных внешних данных. 

Во всех кейсах важно, чтобы аналитика умела работать с неструктурированными данными. Это, прежде всего, текстмайнинг.  Выделение ключевых слов и словосочетаний, характерирующих текст. Например, интересы человека или выявление - "алкоголик" он или не "алкоголик". Первоначально данные просеиваются через математику, которая делает "бездушый" механический анализ. Результат фильтрации такого рода уже можно отправлять в "модели". На выходе рождается степень соответствия конкретного человека той или иной заданной тематике. Математика, например, нашла несколько ключевых слов и словосочетаний. Определяет степень соответствия человека этой теме. И это уже число. Это число идет в моделирование и повышает точность модели. 

Есть второй способ, когда дальше садится лингвист, смотрит на эти слова-словосочетания. В специальной инфраструктуре он может доработать собранные данные до новых характеристик. Например, "вычислить", является ли человек "молодым родителем" или предприниматель. В общем, дойти до конкретики в отношении интерпретируемой сущности. 

Как специалисты в аналитике мы применяем совокупность математики текстмайнинга и контекстно-семантического анализа, что дает те хорошие результаты, которые я вам показываю. 


Внешние данные дают нам много дополнительной информации о взаимосвязях. Наши клиенты и без того анализируют связи между интересующими их персонами, например, анализируя совпадения адресов, телефонов и так далее. Последние наши проекты показывают, что если также смотреть связи человека в социальных сетях, это дает намного больший объем информации. Идея простая - строим граф связей, математика помогает выявить ваше конкретное окружение, выявить реальный круг общения, отсеяв разовые и редкие контакты. А круг общения, как правило, очень многое говорит о человеке. Математика делает это с помощью так называемого кластерного анализа, выделяя тесно связанные сообщества. 

Это позволяет выявлять опасные для страховых компаний ситуации. То же касается и выдачи кредитов. Например, если 15% контактов среди окружения клиента - злостные неплательщики, это рассматривается, как риск повышения вероятности невозврата кредита клиентом и снижает его шансы получить кредит. 

Big Data можно рассматривать и как инновационный подход к анализу, и как использование внешних данных. Здесь задействованы обе стороны темы - текстовая аналитика и умение работать с теорией графов. 


Еще одна специфика моделирования. В целом ряде наших последних проектов мы столкнулись со следующей особенностью. Базово у наших заказчиков в процессе принятия решения задействовано вплоть до 100 показателей (маркетинг, антифрод, управление рисками). Иногда число показателей может быть до 1000. 

После обогащения данных, число показателей с которыми необходимо работать, вырастает как правило до нескольких тысяч. В свежем проекте мы работаем с 9 тысячами показателей. Практика показала, что классические средства анализа более не справляются с ситуацией. Обычная система Data Mining не может работать с базой данных для миллиона клиентов. Получаются десятки или даже сотни ГБ данных, с которыми необходимо работать. 

Здесь мы подошли к еще одному новому аспекту Big Data - к архитектурным инновациям. Вы, вероятно, уже слышали в контексте Big Data термин in-memory аналитика. Это как раз то, что стало необходимым из-за возрастания объемов обрабатываемых внешних данных. 


Вы знаете Hadoop, как средство хранения данных в распределенной среде. Также вы должны понимать, что благодаря Big Data, углубленный анализ также должен "переехать" в распределенную среду. Наиболее быстро данные обрабатываются в оперативной памяти, поэтому самым быстрым сейчас является анализ данных, когда данные вначале поднимают в оперативную память распределенного кластера и там строятся нейронные сети и применяются другие алгоритмы углубленной аналитики. В десятки и сотни раз повышается скорость. И благодаря этому многие наши заказчики имеют возможность работать с Big Data. А без этого, они бы этой возможности не имели. 

Если попытаться этот переход посчитать количественно... мы проводили переход даже без внешних данных. Кейс оператора связи - у него и так тысячи параметров на клиента. Если переселить аналитику из классической среды в распределенную высокопроизводительную среду, за счет того, что аналитик может перебрать большее количество настроек, применить более сложные алгоритмы. На десятки процентов повышается точность моделей. И, как следствие, точность решений. Есть даже расчеты, которые показывают эффект в деньгах. 



Но следует помнить, что еще нужно будет работать с теми параметрами, которые придут к нам из внешних данных. 


Мы говорили о "бездушной" прогнозной модели. Чистая математика. На выходе - набор вероятностей. И по этим вероятностям нужно пытаться принять решение. 

Внешние данные дали существенный толчок к пониманию того, кто такие наши клиенты. 



Собственно, так было всегда. Мы всегда говорили, что есть математика, а есть интерпретируемое понимание наших клиентов. Микросегментация - это не новость. Наши клиенты десятилетиями пытаются понять - где студент, а где пенсионер. 

Раньше большой объем информации о клиентах был практически только у операторов связи. А теперь даже страховые компании, которые традиционно о своих клиентах знают мало что, теперь с учетом внешних данных могут разобраться кто есть кто. Используют соц.-дем. информацию, что у них есть. Добавляют то, что математика + лингвисты могут доставать из соц.сетей.  И в итоге они уже способны отличить с кем имеют дело - с мамой ребенка или "бизнес леди". 

После того, как вы разобрались с соц.демо сегментом, есть различные способы использовать собранную информацию. Во-первых, многие фиксируют эти сегменты и говорят о том, что теперь все решения относительно клиентов будут делаться в разрезе этого сегмента. Например, у нас есть модель кредитного скоринга. Мы разработаем ее вариации для каждого клиентского сегмента, поскольку закономерности, по которым мыслят люди, у каждого социально-демографического сегмента свои. 

Альтернативно. Мы начинаем анализировать профиль потребления продуктов и услуг в каждом сегменте. И на основе этого, зачастую без особой математики, становится понятно, что делать с людьми. 


Например, если в данном сегменте люди, которые приобрели продукт А и продукт Б, часто также приобретают продукт С, здесь математика не нужна, чтобы понять, что следует найти всех клиентов, которые купили А и Б, но еще не купили С, и сделать им соответствующее предложение. 

Поэтому сейчас не редки маркетинговые кампании не на основе аналитических моделей, а на основе бизнес-правил/триггеров.

Мы немного разделяем... бизнес-правила они в целом характеризуют человека. Триггер - это некое событие во времени. Например, наш клиент посетил сайты более, чем трех банков. При этом у нас никакую услугу почему-то не потребил. Значит нужно начинать переживать об оттоке, срочно активизироваться.  

Или, скажем, клиент моего банка ввел где-то в интернете запрос по поиску услуг кредитования. Т.е. он почему-то не обратился ко мне, но что-то ищет в интернете. Опять же стоит активизироваться. 

Маркетологи традиционно не слишком доверяют математике. Тематика Big Data дает им возможность действовать как бы "по наитию". 


Еще один пример того, когда подобный анализ дает нам прозрачное понимание - что следует делать. Задача - выделить сегмент клиентов, который обещает страховой компании существенные убытки.  Построение такого сегмента стоит десятки миллионов рублей, поэтому на слайде не приведена вся информация, извините. 

Но общую идею можно понять. Профиль "опасного клиента" - это такие "артисты", яппи. Профиль хорошо выделяется, с учетом внешних данных. Например, 86% сформированного нами в SAS сегмента приносят страховщикам убытки. Это тот случай, когда без всякой математики понятно, что с ними вообще не нужно заключать договоры КАСКО. Дополнительная информация из интернета существенно помогает и в определении этого профиля, и в его интерпретации. 
  

Хочу подчеркнуть, что для построения профилей, таких, как описанный выше, необходима углубленная аналитика. Такой профиль нельзя просто "собрать" в виде дополнительных характеристик человека из социальных сетей. Нужно сидеть и моделировать. Только совсем в другой среде. Мы разделяем интерфейсы на те, что для математиков, которые строят в нашей терминлогии "бездушные модели", и отдельные интерфейсы для специалиста, который разбирается в предметной области. Который знает, что такое КАСКО,  как выглядит процесс страхования. Он должен разбираться в предметной области, даже если он при этом не является математиком. Перебирая характеристики и строя такие профили, анализируя типовые последовательности потребления услуг, люди могут выделять профили с максимальными убытками, например.  Здесь "замешано" много аналитики, но людям удается это делать. 

Ключевое значение имеет поддержка in-memory аналитики, поскольку для человека очень важна возможность интерактивности при общении с таким инструментом, чтобы можно было оперативно перебирать характеристики клиента, выстраивая значимый клиентский профиль. 

Помните, что Big Data - это не только обмен данными между организациями. Это  инфраструктурные инновации, инновации в подходах к обработке данных. 

Многие называют такой подход к сбору информации - 360 градусов Customer View.

Далеко не про все проекты могу рассказать, но вот еще пара примеров. Сейчас идет очень интересный проект. Корпоративные клиенты. Их много как можно анализировать. Во-первых, у корпоративного клиента всегда есть представитель. У него тоже есть поведение в социальных сетях и многие это анализируют. 

Сейчас у нас есть крупный банк - заказчик. Для него мы, глядя в текстовое поле "назначение платежа", которое клиенты указывают в транзакции, точечно определяем область действия компании. Например, кто среди клиентов - это фермеры. И так по каждому - чем предположительно компания-клиент в основном занимается. Банку хочется такую информацию о клиентах иметь. Теперь этот банк всю свою стратегию общения с клиентами выстраивает, исходя из этого понимания. 

Еще. Считается, что если научиться распознавать переговоры клиентов и операторов контактного центра, то можно ожидать до 30% роста эффективности в управлении оттоком. К сожалению, в России ни один заказчик не смог нам в адекватном виде представить массив таких данных. Между тем, это базовое правило - перед тем, как покупать внешние данные, почему бы вам не попробовать воспользоваться внутренними данными. 

Несколько других кейсов, чтобы абстрагироваться от темы сбора информации о конкретных физических или юридических лицах. 


На картинке пример анализа "умного города". Например, здесь поступает в онлайн-режиме информация со всех водосчетчиков. Две задачи. Во-первых, в любой момент любой потребитель должен иметь возможность посмотреть прогнозный счет по итогам месяца для целей планирования своих расходов. 

Во-вторых, с точки зрения управления городом выявляются статистические профили потребление воды, а отклонения от них позволяет с уверенностью говорить об обнаружении аварий - на ранних этапах детектируются любые "нештатные ситуации". 

Про планирование транспортных потоков говорить не буду, вы наверняка об этом не раз слышали. 


Еще один пример, российский клиент. Big Data, напомню, это во-многом инновационный процесс решения задач. Нередко бывает так, сделала организация у себя Big Data лабораторию. Возможно с задачей анализа внешних данных. Но теперь, лишь возникает какая-то инновационная задача у какого-то департамента, даже не связанная с внешними данными, все вспоминают, что у компании есть развития аналитическая инфраструктура. Поэтому конечно Big Data лабораторию попросят проверить - нельзя ли решить задачу инновационными методами. 

Например, мы проверяли - сколько конкретно специалистов какой конкретной специализации нужно посадить в конкретное отделение банка, чтобы удовлетворить клиентопоток. Это успешно удается просчитать. Математика в таком кейсе хорошо работает, позволяет прогнозировать клиентопоток по дням, выбрав баланс между доходом, расходом на ресурсы и лояльностью абонентов. Чисто математический кейс. 

В целом аналитика Big Data обладает высоким потенциалом для планирования.


Пример для разнообразия. Интернет можно не только мониторить, как сейчас многие делают, но и исследовать. В Швеции, например, изучают форумы, где посетителями являются многие, кто связан с потреблением и продажей наркотиков. И анализируют, например, способы перевозки наркотиков. Текстовая аналитика позволяет выделять слова и словосочетания, которые встречаются рядом, какие из них можно считать ключевыми, какие не являются ключевыми. Например, идет поиск по слову package и анализ - какие слова с ним связаны. Быстро выявляется, что часто употребляется название контейнеров для завтраков, которые перевозчики наркотиков облюбовали для своей деятельности. Благодаря такого рода анализу, полиции удается выявить на ранних этапах маршруты перевозки наркотиков. Например, когда стали усердно проверять самолеты, прилетающие из соседних Нидерландов, текстовый анализ форумов позволил быстро выявить, что трафик привоза наркотиков сместился из Нидерландов на Канаду. Это подтвердили и досмотры, предпринятые в аэропортах. 

Кейсов, конечно, намного больше, они весьма разнообразны. В частности, очень много кейсов сейчас в госуправлении. Возможности Big Data обширны, это тот инструмент, которым нужно пользоваться. 

+ + 




Популярные сообщения

Желающие следить за новостями блога, могут подписаться на рассылку на follow.it (отписаться вы сможете в один клик). 

Еще можно подписаться на Telegram-каналы @abloud62 @abloudrealtime, где также дублируются анонсы практически всех новостей блога. 

 

Translate