bannerbanner
Big data изменяют Китай
Big data изменяют Китай

Полная версия

Big data изменяют Китай

Язык: Русский
Год издания: 2024
Добавлена:
Настройки чтения
Размер шрифта
Высота строк
Поля
На страницу:
3 из 6

Логику, составившую основу этого явления, несложно понять. Во время футбольного матча мужчины полностью погружались в просмотр, оставляя жён (или подруг) и детей без внимания. Женщины, особенно замужние, могли испытывать подавленность, раздражение и разочарование. Каждый раз, когда вечером начинался матч, у каждой женщины в такой ситуации появлялся большой выбор: например, начать делать домашние дела, болтать с подругами, звонить родителям, заниматься онлайн-шоппингом. Её поведение характеризует неопределённость, и предсказать, что именно она в конечном итоге будет делать, сложно. Однако если мы суммируем данные о продажах нескольких электронных торговых площадок и проанализируем их, то увидим, что групповое поведение женщин демонстрирует закономерности, поддающиеся отслеживанию. С началом кубка стал расти объём товаров, купленных женщинами онлайн, среди них увеличилось, по сравнению с обычным временем, и количество товаров высокой ценовой категории, то есть клиентки наконец позволили себе те вещи, на которые в обычной жизни у них не поднималась рука. До наступления эпохи больших данных утверждение «пока мужчины смотрят футбол, женщины занимаются онлайн-шоппингом» так и осталось бы не более чем догадкой, которую невозможно ничем подтвердить. Теперь же, в эпоху больших данных, получить ей подтверждение невероятно просто, причём мы можем проанализировать даже то, какие особенности отличают купленные товары. Во время следующего чемпионата магазины могли давать уже более предметную рекламу, они смогли не только более точно сфокусировать рекламные объявления исходя из адресата рекламы, выбор продвигаемых в них товаров также стал более адресным. Когда догадка выросла в знание, знание создало прибыль.

Помимо описанного выше применения в коммерции всё более распространённым становится использование интеллектуального анализа данных для решения общественных проблем. В июне 2013 года появились сообщения, что некая девушка из Восточно-китайского педагогического университета получила смс от администрации университета следующего содержания: «Уважаемый студент, мы обнаружили, что в прошлом месяце ваши затраты на питание в столовой были сравнительно небольшими. Возможно, вы испытываете финансовые трудности?» [11] Происхождение этого заботливого сообщения также объясняется интеллектуальным отбором данных: в результате анализа данных о тратах, полученных с университетских карточек на питание, администрация обнаружила, что затраты девушки на каждый приём пищи оказались сниженными, что и вылилось в отправку приведённого выше участливого сообщения. Впоследствии, однако, обнаружилось, что была допущена прекрасная ошибка: в действительности девушка просто хотела похудеть. Можно подумать, что причина возникновения ошибки в том, что данные были недостаточно «большими». Особенность больших данных в том, что помимо «большого объёма» они также являются «многоисточниковыми». Если бы помимо карточек на питание были проанализированы другие вспомогательные источники данных, вывод, вероятно, был бы более точным.

Несмотря на расцвет интеллектуального анализа данных, в определённой степени он уже не является передовым и горячим направлением в рамках больших данных, на лидирующих позициях его сменило машинное обучение. Интенсивно развивающееся в настоящий момент машинное обучение также опирается на компьютерные алгоритмы, но его алгоритмы, по сравнению с алгоритмами, использующимися в data mining, вовсе не являются фиксированными, они содержат саморегулирующиеся параметры, то есть в процессе машинного обучения по мере увеличения количества выполненных вычислений и анализов данных параметры алгоритмов непрерывно саморегулируются, вследствие чего результат анализа данных и прогнозирования становится более точным. Кроме того, предлагая компьютеру большой объём данных, мы даём ему возможность, подобно человеку, путём обучения постепенно самосовершенствоваться, поэтому данная технология и получила название «машинное обучение».

Наравне с интеллектуальным анализом данных и машинным обучением очень зрелыми являются также технологии анализа и применения данных, сформировавшие при этом единую систему. Хранилища данных, интерактивная аналитическая обработка (OLAP), визуализация данных, анализ машинной памяти – всё это важные составные элементы данной системы, и в процессе развития технологий сбора и обработки данных они все сыграли важную роль4.

Оглядываясь на более чем полувековую историю информационного общества, отметим, что материальный базис феномена больших данных был заложен только благодаря непрекращающемуся уменьшению размеров транзисторов и снижению их себестоимости, в результате чего у людей появилась возможность создать колоссальное, подобное огромному литому сосуду, хранилище для огромного массива данных. Технология же интеллектуального анализа данных, расцвет которой начался в 1989 году, сопоставима с технологией перегонки сырой нефти в готовый продукт: она является ключом к тому, чтобы большие данные произвели «большую ценность», без этой технологии, насколько огромен бы ни был массив данных, мы могли бы только «глядеть на нефть и бессильно вздыхать». Появившиеся в 2004 году социальные медиа, в свою очередь, сделали каждого из нас потенциальным создателем данных, который вносит свою лепту в наполнение отлитого вследствие действия закона Мура «сосуд», что и является главным фактором формирования «большого объёма». Схематично совокупность описанных факторов показана на рисунке 1.7.



Рисунок 1.7. Три основных формирующих элемента больших данных

Проанализировав статичное понятие «большие данные» и формирующие их динамичные элементы, мы можем более ясно представить особенности этого явления, а также раскрыть его и дать ему определение исходя из разных точек зрения, как это показано на рисунке 1.8.



Рисунок 1.8. Понятие «большие данные» и характеризующие его факторы

Как мы уже говорили выше, в настоящее время 75 % производимых человеком данных – это данные неструктурированные, и именно в форме неструктурированных данных воплощаются крупные массивы зарегистрированных данных. Если мы хотим обнаружить ценность крупных массивов зарегистрированных данных и неструктурированных данных, главный способ обработки их в настоящее время – это всё же преобразование их в строго структурированные, то есть традиционные малые данные. Поэтому, по мнению автора, ценность больших данных главным образом заключается в малых данных и структурированных данных, а их объёмность – прежде всего в существующих в настоящее время крупных массивах зарегистрированных данных и в неструктурированных данных.

Подъём больших данных заставил учёных всего мира строить предположения и гипотезы о том, какое влияние эта «новая волна», вызванная развитием информационных технологий, принесёт человеческому обществу и в каком направлении она поведёт Китай и мир в целом. В следующих главах мы попробуем ответить на эти вопросы применительно к нескольким областям.

ГЛАВА 2. ЦИФРОВОЕ УПРАВЛЕНИЕ: ИСПОЛЬЗОВАНИЕ БОЛЬШИХ ДАННЫХ ДЛЯ ПОВЫШЕНИЯ УРОВНЯ ГОСУДАРСТВЕННОГО И МУНИЦИПАЛЬНОГО АДМИНИСТРИРОВАНИЯ И ГОСУДАРСТВЕННЫХ УСЛУГ


Необходимо построить полноценный механизм, с помощью которого большие данные будут содействовать наукоёмкости процессов принятия решений и социального управления и внедрению инноваций в модели государственного и муниципального администрирования и социального управления, чтобы тем самым достичь научной обоснованности принимаемых органами управления решений, точности социального управления и высокой эффективности государственных услуг.

Высказывание Председателя Си Цзиньпина во время второй коллективной учебной сессии Политбюро ЦК КПК

До 2016 года жителям Чжэцзяна для оформления регистрации купли-продажи вторичного жилья требовалось принести отдельные пакеты документов в три инстанции: министерство земельных и природных ресурсов, министерство жилищного и городского строительства и налоговую службу, – после чего самого оформления следовало ждать ещё какое-то время. Теперь же достаточно обратиться в одно окно с одним пакетом документов, и в течение часа процедура будет полностью выполнена. Оформление свидетельства о праве собственности на недвижимое имущество изначально требовало пятнадцати шагов, для совершения многих из которых нужно было стоять в очередях. На сегодняшний день, благодаря реализации принципа «один номер очереди – получение услуги в одном окне» [14], прежние пятнадцать шагов сведены к трём. Проведённая в Чжэцзяне реформа по «минимизации количества обязательных посещений госучреждений до одного» сделала жизнь обычных людей по-настоящему удобной и приятной.

Сущность реформы по «минимизации количества обязательных посещений госучреждений до одного» состояла не просто в том, чтобы физически свести в одно окна многочисленных государственных и муниципальных учреждений, а в однократной, направленной внутрь «революции» самих этих учреждений. Этот процесс был обеспечен в первую очередь реструктуризацией учреждений и реорганизацией административных процессов, а его ключевыми звеньями стали преодоление обособленности данных и совершенствование механизмов управления данными.

Тем не менее реформа по «минимизации количества обязательных посещений госучреждений до одного» – это всего лишь отправная, но никак не конечная точка в реформировании системы государственных услуг. Существует ещё огромное число направлений для развития той помощи, которую большие данные могут дать в сфере модернизации системы государственного управления и возможностей управления и удовлетворения с каждым днём возрастающей потребности людей в лучшей жизни.

2.1. От «ухода от причудливых справок» до «ухода от справок»

Ещё не так давно СМИ пестрели сообщениями о «причудливых справках», «замкнутом круге справок» и «дублирующих справках». Например, некоторым гражданам при оформлении наследства на недвижимость требовалось предоставить свидетельство о смерти умершего родственника, а некоторым пожилым людям для получения пенсии приходилось документально подтверждать, что они ещё живы. Премьер Государственного совета КНР Ли Кэцян выступил с критикой этого явления на собрании членов Постоянного комитета Госсовета в мае 2015 года. Если в реальности вся подобная информация о жителях страны имеется в распоряжении государства, почему для того, чтобы люди могли получить какую-либо услугу в государственных и муниципальных учреждениях, им нужно самим ходить по всем инстанциям и собирать соответствующие удостоверяющие документы?

Феномен «причудливых справок» объясняется отсутствием совместного межведомственного и межмуниципального доступа к данным, имевшимся в распоряжении части учреждений страны. Раз данные не могли «бегать по делам», делать это приходилось людям и организациям, а сама ситуация, ко всему прочему, оставляла лазейки для фальсификации справок и документов. Наступление эпохи Интернета и больших данных дало решающий ключ для решения этой проблемы.

В 2019 году городском округе Цзиньхуа провинции Чжэцзян, первом среди городских округов страны, развернули работу по созданию «города без справок»: было объявлено, что муниципальные ведомства и общественные учреждения на всей территории округа не должны требовать от граждан и организаций никаких справок или свидетельств, выпущенных каким-либо третьим полномочным органом. Это решение местного правительства образно представлено на рисунке 2.1. Отрадные результаты были получены всего за несколько месяцев ведения работы по созданию в Цзинхуа «города без справок». Была полностью упразднена необходимость предоставлять 18 типов справок и свидетельств, касающихся операций по фонду жилищных сбережений, в частности справка о доходах сотрудника, выписка о жилищном положении, документы, подтверждающие прямое родство того, кто претендует на получение накопительного фонда, и участника фонда, и требующееся в соответствии с политикой льгот на получение ипотечного кредита высококвалифицированными специалистами свидетельство с места работы, подтверждающее соответствующую квалификацию. Таким образом на территории всего округа было реализовано «не требующее справок» получение услуг по фонду жилищных сбережений. Прежде граждане, имеющие иную регистрацию, оформляя в Цзиньхуа разрешение на проживание, должны были сначала получить в министерстве социального обеспечения выписку, удостоверяющую уплату социального страхования за период более полугода, затем с этой выпиской, удостоверением личности и контрактом на аренду жилья прийти в полицейский участок, чтобы подать заявление на оформление разрешения. А сейчас, благодаря совместному доступу к данным, работник учреждения может напрямую запросить информацию о социальном страховании, и от заявителя не требуется никаких дополнительных справок [15].



Рисунок 2.1. Создание «города без справок» (Го Дэсинь/Жэньминь Тупянь)

Реформа по созданию «города без справок» представляет собой полезную попытку сделать государственные услуги более ориентированными на людей, однако местные ведомства не имели полномочий выдавать свидетельства и справки, которые должны оформляться ведомствами других районов. Так, во многих профессиях для осуществления практической деятельности требуется наличие «справки об отсутствии судимости», однако органы общественной безопасности какой-либо местности, оформляя подобную справку, могут удостоверить лишь то, что записи о судимости отсутствуют на подведомственной им территории, соответственно, приезжие служащие вынуждены за такой справкой ехать в место своей регистрации. Сколько же людям пришлось совершить напрасных поездок из-за того, что данные не умеют «бегать» между муниципалитетами?

«Оседлав» разросшийся до масштабов общегосударственной стратегии восточный ветер интеграционного развития региона дельты Янцзы, идёт ускоренное продвижение совместного межмуниципального и межведомственного использования данных правительственных учреждений всех провинций (районных и городских округов) региона. 24 января 2018 года на первой сессии комитета 13-го съезда Народного политического консультативного совета Шанхая лидеры Шанхайского городского комитета партии, обсуждая стимулирование интегративного развития региона дельты Янцзы с позиций подхода, осуществления и ближайших действий, обратили внимание на то, что в регионе необходимо усилить дорожную и информационную сети, а также продвигать реализацию совместного использования данных и предоставления открытого доступа к ним [16]. 11 июня того же года на совместной пресс-конференции с участием «Цзефан жибао», «Вэньхуэй бао» и других СМИ лидеры Шанхайского горкома предложили план по созданию «единой базы данных», подразумевающий совместное строительство регионального центра хранения и обработки данных и унификацию форматов данных, их спецификации, каталогов и интерфейсов, чтобы тем самым сделать источники данных более эффективными в использовании. С одной стороны, такой план направлен на скорейшее содействие созданию исходной базы данных, чтобы в соответствии с единым стандартом ввести в неё государственные, отраслевые и социальные данные разных муниципалитетов. С другой стороны, на осуществление деятельности с опорой на единую платформу для совместного использования данных, их межведомственное и межрайонное использование [17].

В эпоху больших данных конечная цель и идеальное состояние, на которые направлены реформы организационной структуры муниципального управления и реорганизация административных процессов, состоит в создании единого правительства. Упразднение «причудливых справок», «замкнутых кругов справок» и «дублирующих справок» является первым шагом на пути к единому правительству, в котором административные цели и методы ведомств разных районов не только не противоречат друг другу, но и способны друг друга усиливать. Отдав приоритет нуждам граждан, разные ведомства с помощью разработки единой структуры и процедуры, единого финансового контроля, единой технической поддержки и культуры взаимного доверия и ответственности сформируют одно «соединённое без швов» правительство.

К моменту, когда это будет реализовано, простым людям не нужно будет разбираться в разграничении обязанностей между ведомствами, которое даже служащие самих ведомств не всегда могут чётко обозначить; людям также не нужно будет выяснять, как открываются двери в то или иное учреждение, кто его руководитель, к кому лучше обратиться по тому или иному вопросу. И даже зал обслуживания людям не нужно будет посещать. Чтобы без суеты и напряжения получить ту или иную услугу, достаточно будет выполнить несколько действий в телефоне либо пройтись до местной общины. Как и писали учёные Сян Цзин и Ян Гуаньяо, «электронные государственные услуги только тогда смогут принести гражданам максимальную пользу и стать по-настоящему ценными, если смогут экономить время и силы, которые граждане вынуждены тратить при взаимодействии с госучреждениями при подаче заявлений на оказание каких бы то ни было услуг, если будет осуществлено видение граждан о спокойной жизни, состоящее в том, чтобы “не тревожиться ни о мелочах, ни о важных делах”».

2.2. Данные «12345» делают города лучше

В последние несколько лет горячие линии государственных служб, представленные, например, линией «12345», пережив продолжавшиеся много лет объединение и стандартизацию, постепенно становятся важным каналом, с помощью которого широкие массы получают консультации, подают жалобы и получают услуги. Ещё более важным является то, что огромные массивы информации, накопленные горячими линиями государственных служб разных районов, характеризуются большим объёмом, высокой достоверностью, обширной покрывающей площадью, значительной временной эффективностью и другими преимуществами, благодаря чему они смогли помочь правительственным ведомствам лучше понять требования общественности и существующие в муниципальном управлении проблемы и тем самым усилить точность предлагаемых услуг, а также оказали мощную поддержку в сфере повышения уровня управления внутри самих ведомств [18].

По словам руководителя центра по исследованию цифрового управления Чжуншаньского университета Чжэн Юэпина, благодаря горячей линии муниципальных услуг Гуанчжоу на основании анализа большого массива данных о запросах и жалобах со стороны населения за прошедшие несколько лет была сделана предварительная оценка телефонной нагрузки в ближайшие три года, что позволило лучше рассчитать потребности в человеческих ресурсах, рабочих площадках, определить их себестоимость и привести работу в систему, благодаря чему повысилась эффективность распределения ресурсов. Собранные данные также используются для проведения оценки результатов работы сотрудников горячей линии, что обеспечивает постоянное улучшение качества обслуживания. В то же время, благодаря взаимодействию с министерством охраны окружающей среды и органами муниципального управления в сфере использования данных, горячая линия помогает этим ведомствам решать вопросы, касающиеся, например, загрязнения окружающей среды, шумовых помех и незаконного строительства. В городском округе Чжуншань был проведён анализ собранных государственной горячей линией данных, связанных с защитой прав потребителей, что позволило лучше проанализировать существующие в разных микрорайонах, уличных комитетах и торговых центрах проблемы, касающиеся поддельных и низкокачественных продуктов и послепродажного обслуживания, а также выявить новые тенденции, появившиеся в последние годы. Анализ всех этих данных может помочь отделу контроля и управления рынками точно выполнять дифференциацию и категоризацию проблем и тем самым повышать адресность и эффективность контроля и управления.

Дальнейшим шагом станет расширение сферы применения данных горячих линий и их выход за пределы внутриведомственного использования: эти данные также могут быть открыты обществу, чтобы различные его субъекты имели возможность совместно определять ценность ставшей доступной новой информации. В этом плане в других странах есть большой опыт, достойный того, чтобы мы его изучали и перенимали. Например, в Нью-Йорке с жалобой на обнаруженные в парке или на пешеходной дорожке собачьи экскременты можно обратиться на горячую линию: 311. После того, как собранные данные стали доступны общественности, учёные, занимающие наукой о данных, провели комплексное исследование, в котором проанализировали данные жалоб о собачьих экскрементах, данные о велосипедных дорожках Нью-Йорка, данные о расположении велосипедных стоянок, данные о лицензиях на создание уличных ресторанов, а также данные о всеобщем обследовании деревьев на улицах города, и выявили наиболее пригодные для прогулок в летнее время места Нью-Йорка.

В настоящее время горячие линии государственных служб движутся к новой фазе – интеллектуализации. Горячие линии государственных услуг в эпоху больших данных и искусственного интеллекта – это уже не просто колл-центры, для городов они, скорее, стали центрами хранения и обработки данных и смарт-платформами по предоставлению услуг: с помощью интеллектуального анализа больших данных горячих линий можно эффективно идентифицировать общественные потребности и существующие в городах проблемы, чтобы тем самым поддержать движение правительственных стратегий и городского управления в сторону научного подхода и, соответственно, точности [19]. Одновременно с этим открытие подобных горячих линий предоставило ведомствам, предприятиям и жителям города новые возможности для совместного решения существующих общественных проблем, таким образом каждый житель города способен сделать нашу жизнь в городах лучше.

2.3. Как большие данные распознают подлинные «города-призраки»

В 2010 году в одном из новостных сообщений новый район Кангбаши городского округа Ордос автономного района Внутренняя Монголия был назван «городом-призраком». После этого новости, в которых случаи избыточного строительства в разных местах Китая назывались «городами-призраками», следовали одна за другой. Однако встаёт вопрос, являются ли подобные сообщения истинными? Может быть, они частично преувеличены или не соответствуют действительности? Даже имея доказательства, такое сообщение сложно опровергнуть. Например, одни СМИ сообщали о серьёзной ситуации с пустующим жильём в городском уезде Жушань провинции Шаньдун, но при этом есть сообщения и о росте населения Жушаня, что снимает с него ярлык «города-призрака». Кроме того, в некоторых городах из-за стремительного развития туристической индустрии в последние годы было построено множество жилых комплексов для удовлетворения потребностей приезжающих в отпуск людей. В пик туристического сезона количество проживающих в этих комплексах увеличивается, в другие сезоны соответствующим образом уменьшается, превращая их в так называемые «города-призраки». И в действительности описанный феномен спада и подъёма людского потока является нормальным. И всё-таки сказанное вызывает вопрос: каков же настоящий «город-призрак»?

Команда одного из занимающихся наукой о данных китайского учёного – У Хайшаня, проанализировав данные о местонахождении смартфонов, впервые в Китае провела количественное исследование «городов-призраков». Учёные вели мониторинг двадцати районов с относительно высокой долей пустующего городского жилья и смогли дифференцировать застройку, пустующую по причине туристической сезонности, и настоящие «города-призраки». Как показало исследование, коэффициент заселения в некоторых «раскрученных СМИ» как типичные «города-призраки» новых городских районах очевидным образом растёт, тогда как в некоторых старых городских районах, а также модифицированных ресурсно-ориентированных городах была обнаружена пустующая жилая застройка. Так, самый первый «город-призрак», о котором сообщали СМИ, – новый район Кангбаши городского округа Ордос – «призраком» уже не является, чего нельзя сказать о старых городских районах Ордоса, отток населения в которых является более значительным. Похожая ситуация возникла в Тяньцзине. Очень многие считали, что здесь лишь один «город-призрак» – новый район Биньхай, однако анализ данных показал относительно серьёзную ситуацию с пустующим жильём в районе Цзиньнань, располагающемся, что удивительно, далеко не на окраине и имеющем жилую застройку рядом с учебными заведениями и станцией метро. Кроме того, довольно много случаев пустующего жилья обнаружено в таких модифицированных ресурсно-ориентированных городах, как Дунъин в провинции Шаньдун и район Хорчин городского округа Тунляо автономного района Внутренняя Монголия [20]. Известный учёный в области искусственного интеллекта Эндрю Ын прокомментировал это следующим образом: «Пришло время дать возможность машинам планировать городскую застройку на основе данных».

На страницу:
3 из 6