Big Data и анализ данных: взгляд финансового аналитика

Как работать с данными, чтобы получить по-настоящему ценную информацию, и каковы перспективы и опасности больших данных, по мнению Асвата Дамодарана.

Асват Дамодаран, Профессор NYU Stern School of Business (США) и автор ряда книг по оценке стоимости, управлению рисками и корпоративным финансам, в своем блоге «Musings on Markets» играет в своеобразный «манибол» с финансовыми данными. Он собирает данные бухгалтерского учета и рыночные данные обо всех компаниях в мире, акции которых котируются на биржах, и пытается извлечь из всего этого полезную информацию для инвестирования, управления корпоративными финансами и стоимостной оценки. Он размещает классифицированные по отраслевым группам и странам данные на своем веб-сайте, надеясь, что они помогут другим, а эта статья — о цифрах как таковых.

Иллюзии «счетовода»

В своей публикации об интерпретации и цифрах я признавался, что по природе являюсь скорее «счетоводом», чем «рассказчиком», и что на собственном опыте убедился: в стоимостной оценке и инвестировании поглощенность цифрами может мешать. Когда вы читаете мои публикации о том, как выглядят те или иные цифры на начало года, учитывайте, что я, как и все «счетоводы», подвержен трем иллюзиям в отношении данных:

«Цифры точны» 

Я шучу лишь отчасти, когда говорю, что при возникновении сомнений первый порыв «счетовода» — добавить больше знаков после запятой, надеясь, что так цифра будет выглядеть точнее. В действительности цифры точны лишь настолько, насколько точен генерирующий их процесс. Поэтому при просмотре рентабельности акционерного капитала и стоимости капитала, которые я указывают как для компаний, так и для отраслевых групп, имейте в виду следующее. Рентабельность акционерного капитала рассчитывается на основе данных бухгалтерского учета, а на эту величину могут существенно влиять решения касательно расходов и амортизации. Стоимость капитала рассчитывается на основе рыночных данных, что не только делает эту величину динамичной (по мере изменения ставок кредитования и премий за риск инвестирования в акционерный капитал), но и ставит в зависимость от моих решений при расчете, а также от ошибок при оценке премий за риск и параметров риска.

«Цифры объективны»

Одна из основных претензий «счетоводов» к «рассказчикам» — это то, что последние склонны фантазировать и беззастенчиво вплетать свои предвзятые суждения в рассказываемые истории, а через них — и в вопросы ценообразования и инвестирования. Проблема, однако, заключается в том, что цифры могут быть ничуть не менее предвзятыми, чем истории — с той оговоркой, что в цифрах предвзятость легче скрыть. Вот пример. Один из наборов данных, которые я планирую обновить, содержит ставки, по которым американские компании уплачивали налоги в 2016 году. Я предоставляю три показателя ставок налогообложения — от простого среднего значения ставок для всех компаний в секторе (что дает самое низкое значение), до расчета средневзвешенных ставок исключительно по прибыльным компаниям (что дает гораздо более высокое значение). Если вы намерены доказать, что американские компании платят мало налогов, вы продемонстрируете только первую цифру и умолчите об остальном, но если хотите убедить людей в обратном, то возьмете последнюю цифру. Именно поэтому я не стану говорить о своей непредвзятости (поскольку предвзяты все), но предложу несколько способов вычисления широко известных показателей, чтобы вы сами могли решать, какие из них лучше соответствуют вашим целям и представлениям.

«Цифры дают нам контроль»

Для человека естественно стремиться к контролю, и цифры в этом плане для нас служат хорошим помощником. Как и в других аспектах жизни, мы привыкли думать, что прикрепление числа к неустойчивому или неуправляемому показателю позволяет нам его контролировать. Так что позвольте мне сказать очевидное: измерение рентабельности акционерного капитала не превратит плохой проект в хороший — точно так же, как вычисление коэффициента покрытия процентов не поможет в уплате процентов.

Не поймите меня неправильно! Глубоко внутри я остаюсь «счетоводом», но мои отношения с данными стали многограннее и здоровее. Мою веру в данные пошатнул мой опыт работы с ними — особенно когда я увидел, как легко они меняются под воздействием человеческой субъективности. Я доверяю цифрам, но только после того, как их проверил, и я надеюсь, что вы будете поступать так же с данными, которые найдете на моем сайте.

Скептицизм по поводу больших данных

Мой опыт работы с данными сделал меня скептиком в отношении двух самых популярных сейчас концептов в бизнесе — больших данных и анализа данных — по крайней мере в том, что касается зарабатывания денег. Я не спорю, что сегодня компании собирают беспрецедентный объем данных о каждом аспекте нашей жизни, намереваясь использовать эти данные, чтобы получать от нас больше денег. Однако я сомневаюсь, что в нашем капиталистическом обществе большие данные удастся монетизировать. На то есть три причины.

Данные — это не информация! Данные данным рознь. Данные о ваших непосредственных действиях стоят гораздо больше данных о ваших словах и намерениях; ваш оптимистичный твит по поводу Apple, «Твиттера» или всего рынка будет не так полезен, как данные о вашей покупке акций Apple, «Твиттера» или всего рынка. Это следует помнить тем, кто поддается всеобщей тенденции совмещать данные из социальных сетей («Твиттера» и Facebook) с финансовыми для создания «супер» баз данных. И еще один важный момент: собирая и храня все больше данных, нельзя забывать, что данные — это не информация. Основной задачей анализа данных должно оставаться именно преобразование данных в информацию, а не создание симпатичных графиков и малопонятной статистики.

Если у всех это есть (данные), этого нет ни у кого. Реальная ценность у данных будет лишь в том случае, если у вас есть к ним эксклюзивный доступ или уникальный метод их обработки. Это одна из причин, почему большинству инвесторов не удается превратить более широкий доступ к финансовым данным в источник прибыли.

Не все данные можно использовать. Вы должны найти способ монетизации полученных данных. Например, если ваша компания предлагает продукты и услуги, она должна будет модифицировать существующие или ввести новые продукты/услуги в соответствии с полученной информацией.

Глядя на эти три фактора, легко понять, почему Netflix и Amazon стали яркими примерами пользы от больших данных. Они наблюдают за нашими (потребителей) действиями — Amazon за тем, что мы покупаем, а Netflix за тем, что мы смотрим на наших устройствах — и не только обладают эксклюзивными правами на эту информацию и могут использовать ее для модификации своих предложений, но и подталкивают с ее помощью нас к выгодному для них поведению. Соответственно, вы можете также понять, почему использование больших данных для инвестирования в лучшем случае даст вам лишь временное преимущество, и почему я без каких-либо колебаний делюсь своими данными.

Что за данные?

Я чувствую себя обязанным рассказать всем, кто использует мои данные, о том, как собираю и анализирую их, а также предупредить о некоторых моментах.

Исходные данные. Первый шаг в этом процессе — это сбор исходных данных, и я глубоко благодарен сервисам данных, которые позволяют мне это делать. Я использую S&P Global Market Intelligence, Bloomberg и множество специализированных сервисов (Moody’s, RPS и другие). Единственный критерий включения компании в мой список — это ее рыночная капитализация выше нуля; на 1 января 2017 года я нашел 42 678 таких компаний. Все данные приведены по состоянию на 1 января 2017 года, причем рыночные данные (цена акций, рыночная капитализация и процентные ставки) приводятся именно на этот момент, а данные бухгалтерского учета отражают последние 12 месяцев (то есть до 30 сентября 2016 года для компаний, использующих финансовый год).

Классификация. Сначала я разделяю компании на пять географических групп: США, Япония, развитые европейские страны (включая ЕС и Швейцарию), развивающиеся страны (включая Восточную Европу, Азию, Африку и Латинскую Америку), Австралия/Новая Зеландия/Канада — довольно произвольная классификация, которой я придерживаюсь по историческим причинам. 
Я также классифицирую компании по 96 отраслевым группам, опираясь на классификацию отраслей, используемую сервисами сбора данных, и коды SIC. Сведения о количестве компаний в каждой отраслевой группе с разбивкой по географическим группам можно найти по этой ссылке, а конкретные компании в каждой отраслевой группе — по этой ссылке.

Ключевые цифры. Как правило, я не указываю многие макроэкономические показатели (процентные ставки, инфляция, рост ВВП и т. д), так как есть источники данных гораздо лучше, из которых моим любимым остается FRED (база данных Федерального резервного банка Сент-Луиса). В начале каждого года я обновляю расчетные значения премий за риск инвестирования в акционерный капитал — не только по США, но и для большинства стран мира— и снова обновлю их в июле 2017 года. Используя данные о компаниях, я указываю десятки показателей для отраслевых и географических групп, включая рентабельность, стоимость капитала и оценочные мультипликаторы — с полным списком можно ознакомиться здесь.

Подробности о вычислениях. Один из уроков, которые я вынес из своих сражений с данными, — это то, что расчет даже простой статистики требует принятия определенных решений, которые могут быть субъективными. Например, при вычислении коэффициента цена/прибыль для металлургических предприятий США я могу просто вычислить средний коэффициент, но это не только устранит всякую разницу между малыми компаниями и гигантами, но и устранит из моей выборки компании, показавшей в бухгалтерской отчетности убытки (что внесет искажение в мои расчеты). Именно поэтому при расчете усредненной статистики по отраслям я сначала агрегирую значения всех компаний, а затем вычисляю коэффициенты. Соответственно, для расчета коэффициента цена/прибыль для металлургических предприятий США я вычисляю совокупную чистую прибыль всех металлургических компаний (включая убыточные) и рыночную капитализацию этих же компаний и делю первое на второе. Поскольку я вычисляю средневзвешенные значения по всем компаниям в каждой отраслевой группе, этим, возможно, объясняется отличие моих цифр от тех, что указывают другие сайты.

Представление данных. Я много думал над тем, как лучше представлять эти данные, чтобы вы могли без труда найти то, что вам нужно. Идеального шаблона я не нашел, но найти необходимые данные вы сможете следующим образом. Текущие данные (на январь 2017 года) вы найдете по этой ссылке. Вы увидите данные, классифицированные по риску, рентабельности, структуре капитала и дивидендной политике (в соответствии с моей ориентацией на корпоративные финансы), а затем — по ценовым группам (мультипликаторы прибыли на акцию, балансовой стоимости и выручки). Я также храню архивированные данные за предыдущие годы (начиная с 1999 года), доступные по этой ссылке. К сожалению, сопоставление по годам будет неидеальным, так как за последние 20 лет мне приходилось несколько раз менять поставщиков исходных данных, в результате классификация отраслей и перечень показателей для разных периодов разные.

В заключении…

Всю работу делаю я один, поэтому уверен, что среди наборов данных есть и такие, которые я не обновил или в которых чего-то не хватает. Если найдете такие, сообщите мне, и я постараюсь их исправить. Я также не считаю себя поставщиком исходных данных, особенно в реальном времени и по отдельным компаниям. Так что я не планирую обновлять эти данные в течение года — отчасти потому, что среднеотраслевые значения вряд ли серьезно изменятся за несколько месяцев, и еще потому, что у меня есть и другие дела.

Оригинал публикации на английском языке, а также обзоры компаний и отраслей с использованием данных, о котрых пишет профессор, — в блоге Асвата Дамодарана.

Подать заявку на участие в программе «Оценка стоимости бизнеса» 15-16 июня в бизнес-школе СКОЛКОВО можно по ссылке.