09:11, 11 сентября 2017, 09:11
Количество просмотров 6785

Информационные модели интернет-магазинов. Техническая составляющая

Мы продолжаем публикацию цикла статей компании Content-House, посвященных тонкостям создания и структурирования контента в современном интернет-магазине. Антон Баташов, руководитель департамента развития контента Content-House, рассказывает об информационных моделях, применяемых при описании продуктов.
Информационные модели интернет-магазинов. Техническая составляющая

 - рис.1

Продолжаем публикацию цикла статей компании Content-House, посвященных тонкостям создания и структурирования контента в современном интернет-магазине[1].

Антон Баташов, руководитель департамента развития контента Content-House, рассказывает об информационных моделях, применяемых при описании продуктов.

Сегодня мы поговорим об информационных моделях, а точнее – об их технической составляющей, столь необходимой для создания современного описания продукта. Для начала, если позволите, немного истории.

В далеких 90-х с началом бурного развития интернета начинают появляться не только первые сайты, но и первые российские интернет-магазины. Естественно, их никто не воспринимает всерьез. Крупный бизнес аккуратно, оценивающе и, главное, издалека смотрит на это копошение и продолжает зарабатывать деньги на своих основных направлениях. Как результат, все первые интернет-магазины работают на самописных движках, имеют небольшой ассортимент и живут за счет оптимизма энтузиастов. Назвать прибыль первых магазинов результатом бизнес-деятельности не поворачивается язык. На этот момент практически ни у кого нет понимания того, что такое структурированная информация и каким целям она служит. Создание описания продуктов осуществляется с помощью web-разработчика, который пишет для каждого продукта свою отдельную страницу на html.

Время идет, интерес растет, появляются первые CMS. Начинают расти первые магазины, в которых увеличивается ассортимент и, как следствие, возникают требования к категоризации. В интернет-магазинах появляются каталоги, продукты в которых по-прежнему описываются обычным текстом, хотя уже и с форматированием и картинками, но суть не меняется – в них по-прежнему нет структуры.

Так продолжается до начала 2000-х годов, когда на рынок начинают массово выходить не только интернет-магазины, но и онлайн-каталоги. В них содержится уже просто неприличное количество товаров. Найти что-то в таком ассортименте все сложнее и сложнее. Именно тогда начинают вводиться первые фильтровые характеристики, пока что самые простые, такие как выбор значения из списка и логические «Да/Нет». Для разработчиков тех лет основной задачей, которая решается фильтровыми характеристиками, становится обеспечение возможности фильтрации продуктов в категории хотя бы по брендам и нескольким основным признакам. Но такое решение не всегда оптимально, поэтому некоторые компании идут дальше и начинают использовать для описания товара не только текст и несколько фильтров, но и полный набор атрибутов с перечислением всех характеристик товара.

При этом вполне логично, что для каждого типа товаров данный набор атрибутов разный, ведь описывать товары при помощи одних и тех же характеристик – не очень хорошая идея. Хотя многие характеристики дублируются из модели в модель, например, габариты, сертификаты, логистическая информация и т.д. Данные наборы и есть информационные модели.

Информационная модель – это набор атрибутов различных типов, объединенных в логические группы и предназначенных для описания того или иного типа товаров.

Одной из первых компаний, которая начинает применять информационные модели, становится CNet Content Solutions – американский контент-провайдер, для которого задача доставки описаний разным клиентам в различном формате критична и не может быть решена другим быстрым и дешевым способом.

К тому же применение информационных моделей позволяет ей существенно уменьшить количество орфографических и грамматических ошибок, ведь работа аналитика теперь сводится не к написанию значений, а к выбору их из возможного списка, да и проверять такие описания с помощью автоматизированных механизмов проще. За лидером начинает тянуться весь рынок. Сегодня существует более десяти PIM (Product Information System) систем, которые позволяют создавать полноценные описания товаров, состоящие из целого набора атрибутов разных типов.


Типы атрибутов

Современные системы PIM позволяют использовать различные типы атрибутов.

Текст. Один из первых разработанных типов атрибутов. По сути, является строкой для ввода текста определенной длины. Позволяет описывать характеристики, которые плохо формализуются и преобразуются в список. На самом деле, это бесполезный тип атрибута, потому что он не позволяет использовать преимущества структурированной модели. Атрибуты данного типа невозможно использовать для фильтрации, сравнения, подбора и экспорта. Вы ничего с ним сделать не можете (разве что переименовать или автоматически перевести), вы всегда будете отдавать его значения в неизменном виде. Атрибут в данный момент используется крайне редко или вообще не используется.

Ввод дробного. Используется для хранения числовых значений характеристик. Любые числовые значения, будь то вес продукта, его длина или объем установленной памяти, должны быть описаны с помощью данного типа атрибутов. Это важно, поскольку в дальнейшем данный тип позволяет строить огромное количество автоматизированных сервисов по поиску, подбору и сравнению продуктов. Данный тип появился одним из первых, но он до сих пор сохраняет свою актуальность и используется повсеместно. Из последних существенных нововведений в данный тип можно назвать добавление единиц измерения и автоматическую конвертацию размерности. Но об этом я расскажу позже.

Ввод целого. Используется для ввода значений характеристик, имеющих тип «целое число», например, атрибут «Количество слотов для установки модулей памяти» будет иметь тип «Ввод целого», ведь, например, в ноутбуке не может быть 1,25 слота. По сути, данный тип был добавлен для уменьшения вероятности ошибок при заполнении описаний, ведь он не позволяет заполнить и хранить дробное число.

«Да/Нет». Один из первых разработанных типов атрибутов. Смысловую нагрузку несет только название. Представляет из себя триггер, показывающий, есть ли такая характеристика у продукта. Достаточно неудобный тип атрибута, так как при его использовании размер информационной модели начинает сильно разрастаться. В таком количестве атрибутов аналитику становится тяжело найти что-либо, программистам на основе таких атрибутов сложно строить аккуратные, небольшие фильтры, для пользователя же усложняется задача найти что-либо в таких фильтрах, да и описания читаются не очень хорошо.

Выбор одного значения из списка. Распространенный тип атрибута, поддерживаемый большинством современных систем PIM. Является развитием атрибута «Да/Нет». Позволяет хранить одно значение атрибута из списка возможных значений. Используется в ситуации, когда продукт априори не может иметь несколько возможных значений данного атрибута. Яркий пример атрибута данного типа «Установленный процессор» в информационной модели «Ноутбуки». Я смутно себе могу представить ситуацию, когда на рынок выйдет ноутбук с двумя РАЗНЫМИ процессорами.

Выбор многих значений из списка. Один из ключевых типов атрибутов, без которого создание информационной модели легко может превратиться в ад. Если PIM поддерживает атрибуты с типом «выбор многих значений из списка», но не поддерживает «выбор одного значения из списка», то мы теряем в качестве создаваемых описаний (остается вероятность ошибки аналитика, когда он указывает два значения, хотя может быть только одно), но не теряем в логике построения информационной модели и сохраняем ее стройную структуру. Если же PIM не поддерживает данный тип атрибута, информационная модель начинает сильно разрастаться из-за необходимости использовать атрибут «Да/Нет». При этом ее администрирование превращается в непростую задачу.

 - рис.2



Рис. 1. Сравнение структуры ИМ с использованием “выбор многих” и без.

С основными, базовыми типами атрибутов мы закончили. Любая современная PIM-система должна поддерживать все выше перечисленные типы атрибутов. По существу, возможно, обойтись без «Ввод целого», «Текст» и «Выбор одного», но именно благодаря полному набору поддерживаемых типов можно создавать красивые и стройные информационные модели и описывать любые существующие типы товаров.

Но это еще не все! Наиболее продвинутые PIM-системы поддерживают дополнительные типы атрибутов, которые в первую очередь не расширяют функциональность, а позволяют более качественно реализовывать информационные модели с одной стороны и уменьшить вероятность ошибок с другой. Рассмотрим их.

Диапазон. Данный тип используется для хранения диапазона значений числовых характеристик. Он позволяет для одной характеристики задать два значения. Ярким примером может служить характеристика «Диапазон рабочих температур», в которой производитель указывает диапазон температур от –10 до +50. Естественно, отсутствие данного типа все равно позволит нам описать данную характеристику, но не так изящно, ведь нам надо будет использовать две характеристики «Минимальная рабочая температура» и «Максимальная рабочая температура».

Цвет. Данный тип атрибута используется для того, чтобы указать цвет продукта в целом или его части. Реализуется по-разному, в зависимости от PIM. Где-то это единый набор текстовых значений с привязкой номера цвета из палитры RGB, где-то полноценная палитра с возможностью выбрать тот или иной цвет или даже получить цвет с помощью «пипетки» из реальной фотографии продукта. В некоторых PIM функционал позволяет объединить описание всех цветов продукта в одной характеристики, задавая процент заполнения тем или иным цветом, например ноутбук на 40% серый, на 40% черный и на 20% белый. В общем, вариантов реализации данного типа достаточно много.

Дата. Используется для указания даты в стандартном формате. Применяется довольно редко в силу того, что временных характеристик, требующих описания, немного.

EAN или штрихкод. Достаточно редкий тип атрибута. Предназначен для хранения информации о штрихкодах продукта. Имеет механизмы проверки корректности на лету.

С типами атрибутов мы закончили. Я более чем уверен, что существует еще много разнообразных типов атрибутов, которые используются в том или ином PIM, но перечислять их все нет смысла.

Дополнительный функционал

Теперь поговорим о дополнительном функционале, который позволяет еще более качественно создавать информационные модели и еще более правильно описывать продукты, уменьшая количество ошибок и трудовых затрат.

Единицы измерения

Мы долго думали, куда отнести данный механизм, ведь по сути это не еще один тип атрибута, а скорее дополнительный функционал, который работает совместно с атрибутами «Ввод целого», «Ввод дробного» и «Диапазон». Его суть заключается в том, чтобы дать возможность указывать, в каких единицах измерения задано значение той или иной характеристики. В качестве примера возьмем самый простейший PIM и посмотрим, как в нем можно указать размерность веса:

 - рис.3

Как мы видим, такая запись читается не очень хорошо, да и аналитику, который заполняет продукты в такой информационной модели, необходимо всегда указывать значения в единой размерности (в килограммах), даже если производитель указывает, например, в граммах. То есть аналитик вынужден конвертировать вес и приводить его к единой размерности, а это дополнительные затраты времени и возможность совершения ошибки.

Функционал единиц измерения решает эту задачу. В результате характеристика выглядит следующим образом:

 - рис.4

Как мы видим, данная запись более понятна и лучше читается. Аналитику теперь нет необходимости приводить единицы измерения к общей размерности, ему достаточно ввести число, указанное производителем и выбрать нужную размерность из списка. Дополнительным плюсом функционала единиц измерения является возможность автоматически приводить единицы измерения всех продуктов в данном типе товаров к единой размерности и всегда выдавать на сайт вес в килограммах, а в случае необходимости, перестроив систему, в граммах или в унциях, если кому-то так удобнее.

Логические группы

Многие PIM-системы позволяют объединять несколько характеристик внутри информационной модели в группы. Делается это в первую очередь для лучшей читаемости, как информационной модели, так и результирующего описания (если у вас нет разделения на внутреннюю и внешнюю информационную модель).

Внутренняя информационная модель находится внутри вашей PIM-системы, оптимизирована для удобства и скорости работы с ней аналитиков.

Внешняя информационная модель находится на витрине магазина (то, что видит клиент). Внутренняя и внешняя ИМ могут существенно отличаться, если реализован механизм преобразования информационных моделей.

Аналитику проще найти ту или иную характеристику отыскав сначала группу. Покупателю, который просматривает описание товара, проще пролистать до группы «Интерфейсы» и внутри нее искать нужный ему интерфейс.

Вместо заключения

Дело в том, что создание информационной модели – процесс долгий, сложный и требует достаточной квалификации. Чтобы описать его корректно, мы должны были в самом начале дать вам общий фундамент, понимание, из чего строятся современные информационные модели. В следующей статье разберем непосредственно процесс создания информационной модели, то есть работу эксперта, который занимается ее разработкой.

[1] http://www.retail-loyalty.org/expert-forum/formirovanie-kontenta-v-internet-magazine-otdelnyy-katalog-blazh-ili-blago/; http://www.retail-loyalty.org/expert-forum/formirovanie-kontenta-v-internet-magazine-klassifikatsiya-i-kategorizatsiya/


Эту и другие темы мы обсудим на нашем ПЛАС-Форуме «Online & Offline Retail 2018» — ключевом мероприятии для ритейла и e-commerce, посвященном современному состоянию и перспективам развития розничной индустрии. Мероприятие, которое пройдет 14-15 марта 2018 года, организует журнал «Retail & Loyalty».  Зарегистрироваться в качестве участника Вы можете здесь. Будем рады встрече с Вами на Форуме!

Рубрика:
{}
Теги:

ТАКЖЕ ПО ТЕМЕ