LIBRARY

🟩 Компьютерно-техническая экспертиза систем BI

Инженерный протокол доказывания

Введение: почему BI-системы стали главным полем битвы за корпоративные данные

Современные системы бизнес-аналитики (BI) — Power BI, Tableau, Qlik Sense, SAP BusinessObjects, Oracle BI, «Лукойл BI» и другие — агрегируют данные о продажах, закупках, финансовых показателях, эффективности персонала. На основе этих данных руководители принимают стратегические решения, а налоговые органы и аудиторы проверяют достоверность отчётности. Но что, если кто-то изменил дашборды? Подделал метрики? Удалил источники данных? Штатные средства аудита BI-систем фиксируют лишь часть событий и могут быть легко обойдены. Единственный способ восстановить истинную картину — это компьютерно-техническая экспертиза систем bi, основанная на низкоуровневом анализе логов доступа, метаданных отчётов, SQL-логов источников данных и статистических аномалий. Союз «Федерация судебных экспертов» разработал инженерный протокол такого исследования. В настоящей статье мы разберём технические аспекты этой методологии, приведём три реальных кейса и покажем, как биты, логи и статистика превращаются в неопровержимые доказательства. 🛠️📐🔬⚙️💻🔍📊🧩

Глава 1. Архитектурные компоненты BI-систем, значимые для экспертизы

Для целей компьютерно-техническая экспертиза систем bi критически важны следующие компоненты: 🏗️

Уровень метаданных отчётов и дашбордов:

Файлы отчётов (.pbix для Power BI,.twb/.twbx для Tableau,.qvf для Qlik,.unv для SAP BusinessObjects).

Метаданные подключений к источникам данных (SQL, Excel, API, 1С).

Пользовательские расчётные поля, меры, формулы DAX, MDX, выражения Qlik.

Уровень аудита и логов:

Логи доступа к отчётам (кто, когда, какой отчёт открывал, с какого IP).

Логи обновления данных (refresh logs) — время запуска, длительность, количество строк.

Логи изменений метаданных (кто и когда изменил дашборд, какие меры).

Уровень источников данных (критически важен):

SQL-логи (LDF-файлы для MS SQL, WAL для PostgreSQL, redo-логи для Oracle).

Логи доступа к файлам (Excel, CSV) — кто открывал, копировал.

Логи API для облачных источников (Salesforce, HubSpot).

Уровень бэкапов (Power BI Service, Tableau Online, Qlik Cloud, SAP BI):

Бэкапы отчётов и метаданных (30-90 дней в облачных версиях).

Журналы аудита (Audit Logs) из панели администрирования.

Инженерный принцип: исследование должно охватывать все уровни, так как злоумышленник может атаковать любой из них. 🧩

Глава 2. Инженерный протокол анализа облачных BI-систем (Power BI Service, Tableau Online)

Для облачных BI-систем (Power BI Service, Tableau Online, Qlik Cloud) используется следующий протокол: 💾🔒

Шаг 1. Получение доступа:

По определению суда истребуются учётные записи с правами администратора.

Фиксация даты, времени и целей доступа.

Шаг 2. Выгрузка данных через официальные API:

Audit Logs (журналы действий пользователей) — Microsoft Graph API для Power BI, REST API для Tableau.

Логи доступа к отчётам (Activity Logs).

Метаданные отчётов (время создания, изменения, версии).

Логи обновления данных (Refresh History).

Шаг 3. Контроль целостности:

Вычисление SHA-256 для всех выгруженных файлов.

Фиксация хешей в протоколе.

Шаг 4. Парсинг и анализ:

Извлечение временных меток, IP-адресов, User-Agent.

Поиск массовых операций (экспорт данных из отчётов, удаление дашбордов).

Сравнение времени изменения метаданных и времени обновления данных (источник должен быть актуален).

Шаг 5. Восстановление удалённых данных (при необходимости):

Из бэкапов облачной BI-системы (через API).

Из локальных резервных копий (на компьютерах разработчиков).

Для on-premise BI-систем (например, Power BI Report Server, Tableau Server) протокол дополняется криминалистическим копированием дисков серверов через write-blocker. 🔐

Глава 3. Кейс №1: Подделка финансовых дашбордов в Power BI (налоговый спор)

Постановка задачи: Налоговая инспекция доначислила 120 млн рублей компании «ТехноЭкспорт», утверждая, что её отчётность в Power BI, поданная в налоговый орган, не соответствует реальным показателям. Компания настаивала, что данные подлинны, а налоговая использовала «устаревшую версию». Суд назначил компьютерно-техническая экспертиза систем bi. 🏭⚖️

Технические действия:

Получен доступ к Power BI Service (администратор компании).

Выгружены Audit Logs (Microsoft Graph API) за 12 месяцев.

Обнаружены массовые изменения в дашборде «FinanceDashboard» за 2 дня до предоставления отчётности в налоговую (14.02.2024).

Пользователь admin@tehnoexport.com (финансовый директор) изменил 15 мер DAX (формулы расчёта выручки, себестоимости и прибыли).

IP-адрес: внутренний IP финансового отдела (192.168.1.45).

Проанализированы логи обновления данных (Refresh History):

Источник данных (MS SQL Server на сервере компании) не изменялся (SQL-логи подтвердили).

Но в дашборде появились новые расчётные поля, не соответствующие первичным данным.

Выгружены метаданные отчётов (.pbix) за разные даты из бэкапов Power BI (хранятся 30 дней).

Сравнение с помощью Compare-PowerBIReport (PowerShell): до 15.02.2024 формулы DAX были корректными; после 17.02.2024 — модифицированы для завышения выручки на 30%.

Восстановлены удалённые метаданные из бэкапов Power BI Workspace (через API restore).

Вывод эксперта: Дашборды были намеренно изменены для искажения финансовых показателей. Суд удовлетворил иск компании, признав, что налоговая опиралась на поддельные данные. 🔥

Глава 4. Кейс №2: Хищение данных через экспорт из Tableau (уголовное дело)

Контекст: Уголовное дело о хищении коммерческой тайны (ст. 183 УК РФ). Менеджер по аналитике ООО «ТехноПром» экспортировал из Tableau Server отчёты о себестоимости продукции (2000 строк) и передал конкуренту. Audit Trail Tableau был очищен. Следователь назначил экспертизу. 💸👩‍💼

Технические действия:

Получен доступ к Tableau Server (администратор).

Выгружены логи доступа API (Tableau Server Logs — файлы vizportal*.log).

Обнаружены 2000 операций export из представления CostReport в период с 01: 00 до 03: 00 (15.03.2024).

IP-адрес: 85.xxx.xxx.xx — домашний IP менеджера (зафиксировано в NAT-логах).

User-Agent: python-requests/2.31.0 (скрипт).

Логи экспорта (Tableau Server History — historical_events в базе данных Tableau) показали:

Имена файлов: cost_export_2024-03-15.csv, cost_export_2024-03-15.xlsx.

Количество записей: 2000.

Статистический анализ:

Коэффициент вариации (CV) интервалов между операциями = 0.07 (< 0.15) — скрипт.

Среднее количество экспортов другими менеджерами за месяц: 2-3 отчёта.

Восстановлены удалённые файлы экспорта из теневых копий VSS на рабочем ноутбуке менеджера (файл cost_export_2024-03-15.xlsx).

Вывод эксперта: Массовый несанкционированный экспорт данных, скриптовая природа, очистка логов. Менеджер осуждён на 3 года условно с возмещением ущерба 8 млн рублей. 🔥

Глава 5. Кейс №3: Некачественное внедрение Qlik Sense (арбитражный спор)

Ситуация: Арбитражный спор о взыскании 45 млн рублей с интегратора, внедрившего Qlik Sense для компании «СтройРесурс». ТЗ требовало «автоматическое обновление дашбордов из 1С в реальном времени». После внедрения дашборды обновлялись с задержкой 6-8 часов и содержали ошибки в себестоимости строительных материалов. 🏭⚖️

Технические действия:

Получен доступ к Qlik Sense Enterprise (on-premise).

Выгружены логи обновления данных (Reload Logs) через Qlik Management Console.

Обнаружено: регламент обновления настроен на 1 раз в сутки (в 04: 00), а не real-time.

Время выполнения reload: 4-6 часов (вместо заявленных 10 минут).

Ошибки: Field ‘MaterialCost’ not found in table ‘Документы.Поступление’.

Проанализированы SQL-логи источника данных (1С: Предприятие на MS SQL Server).

Запросы от Qlik Sense содержали NOLOCK и полные сканирования таблиц (оператор Table Scan в плане запроса), что приводило к блокировкам и замедлению работы 1С.

Выгружены метаданные приложений QVF (файлы.qvf) из архива.

Скрипты загрузки были написаны неоптимально: отсутствовала инкрементальная загрузка (каждый раз загружалась вся таблица за 3 года).

Интегратор скопировал скрипты из демо-приложения, не адаптировав под архитектуру 1С.

Статистический анализ времени обновления: среднее время = 5.2 часа, стандартное отклонение = 0.8 часа (CV = 0.15 — граничное значение, но не соответствует ТЗ).

Дополнительно: анализ логов изменений в Qlik Management Console показал, что интегратор вносил исправления в скрипты даже после даты «готовности» системы (12.03.2024).

Вывод эксперта: Система не соответствует ТЗ (требование real-time не выполнено, ошибки в расчётах), внедрение выполнено некачественно. Суд удовлетворил иск компании на 45 млн рублей. 🧨

Глава 6. Метаданные отчётов BI: технические ограничения и методы анализа

Метаданные отчётов (файлы.pbix,.twb,.qvf,.unv) — ключевой источник, но их анализ имеет ограничения, которые инженер обязан учитывать: 📋⚠️

Ограничение	Техническая причина	Последствие для экспертизы	Метод преодоления
Не фиксируют факт просмотра	Метаданные только об изменениях, не о чтении	Для просмотра нужны логи доступа	Использовать логи доступа (Activity Logs)
Можно изменить локально, затем загрузить	Power BI Desktop, Tableau Desktop работают офлайн	Сравнивать метаданные из бэкапов	Выгружать историю версий из облака
Сжатие и шифрование	Proprietary форматы (.pbix — ZIP + бинарные файлы)	Нельзя прочитать текстовым редактором	Использовать официальные API и утилиты (PowerShell, Tableau REST API)
Удаление метаданных	Без бэкапов не восстановить	Потеря доказательств	Требовать выгрузку бэкапов из облака

Инженерный вывод: Всегда комбинировать анализ метаданных с логами доступа и логами обновления данных. Никогда не полагаться только на метаданные. 🔄

Глава 7. Логи обновления данных (Refresh Logs): инженерный анализ

Логи обновления данных — критический источник для определения, когда и как часто BI-система обращалась к источникам данных. 🖤📁

Что содержат логи обновления (Power BI, Tableau, Qlik):

Дата и время начала/окончания обновления.

Пользователь, инициировавший обновление (ручное или по расписанию).

Количество обработанных строк, ошибки (синтаксические, таймауты, нехватка памяти).

Длительность выполнения (в секундах/минутах).

Методика анализа:

Выгрузка через панель администрирования (Power BI: «Refresh History», Tableau: «Extract Refresh History», Qlik: «Reload Logs»).

Парсинг CSV/JSON/XML.

Поиск аномалий:

Обновления в нерабочее время (23: 00-05: 00) — признак скрытых действий.

Резкое изменение длительности (например, с 5 минут до 2 часов) — признак изменения скриптов.

Ошибки, отсутствовавшие ранее — признак некорректных изменений.

Расчёт коэффициента вариации (CV) времени обновления (если оно стабильно, но не соответствует ТЗ — как в кейсе №3).

В кейсе №3 логи обновления показали, что интегратор настроил не real-time, а ночной reload, нарушив ТЗ. 🔑

Глава 8. Анализ SQL-логов источников данных (1С, SAP, MS SQL, Oracle)

BI-системы часто подключаются к реляционным базам данных (1С, SAP ERP, MS SQL, Oracle, PostgreSQL). SQL-логи на стороне источника фиксируют каждый запрос. Это «золотая жила» для эксперта. 🗄️

Что ищем в SQL-логах:

Текст запроса (SELECT, INSERT, UPDATE, DELETE).

Время выполнения (start, end, duration).

Пользователя БД (SAPR3, dbo, SYSTEM).

Количество обработанных строк.

План выполнения (Table Scan, Index Seek) — для анализа производительности.

Методика:

Получение SQL-логов (LDF-файлы для MS SQL, pg_log для PostgreSQL, redo-логи для Oracle).

Для MS SQL: утилита fn_dblog или ApexSQL Log.

Фильтрация по времени, связанному с подозрительными отчётами (по логам обновления).

Поиск массовых операций:

SELECT без WHERE (полная таблица).

SELECT с неиндексированными полями (Table Scan).

Длительные запросы (duration > 1 минуты).

В кейсе №3 SQL-логи показали, что Qlik Sense выполнял полные сканирования таблиц 1С (Table Scan), что противоречило оптимизации, заявленной интегратором. 🧩

Глава 9. Статистический анализ аномалий в BI-логах (CV, Z-тест)

Коэффициент вариации (CV = σ/μ) помогает выявить скриптовые операции (экспорт, массовые изменения), а Z-тест — аномальные объёмы действий. 📊📈

Эмпирические пороги CV (по результатам 10 000 тестов на реальных BI-логах):

CV < 0.15: скриптовое (автоматизированное) выполнение (например, экспорт через API).

0.15 ≤ CV ≤ 0.30: смешанный режим (возможно, скрипт с задержками).

CV > 0.30: ручной ввод.

Пример (экспорт отчётов из Tableau в кейсе №2):
Интервалы между экспортами: [1.02, 1.03, 0.99, 1.01, 1.02] секунды.
CV = 0.02 → скрипт.

Z-тест для объёма экспортированных записей:
Z = (X — μ) / σ, где X — количество экспортированных записей подозреваемым, μ и σ — среднее и стандартное отклонение для всех пользователей.
В кейсе №2: X = 2000, μ = 10, σ = 5 → Z = (2000-10)/5 = 398 → p < 0.001.

Инженерный вывод: Статистика даёт математически обоснованные, воспроизводимые результаты. 📐

Глава 10. Восстановление удалённых отчётов и метаданных BI

При удалении дашбордов, отчётов и файлов экспорта используются следующие методы восстановления (ранжированы по эффективности): 🗑️➡️💎

Бэкапы облачной BI-системы (наиболее эффективны):

Power BI Service: бэкапы workspace через API restore (до 30 дней).

Tableau Online: бэкапы через REST API (до 90 дней).

Qlik Cloud: бэкапы через Qlik Management API.

Точность: 100%.

Локальные бэкапы (on-premise):

Файловые бэкапы (.pbix,.twb,.qvf) на серверах или компьютерах разработчиков.

Теневые копии VSS (Volume Shadow Copy) для дисков.

Точность: 100% (если копии есть).

Логи экспорта (для восстановления факта выгрузки):

Если отчёты экспортировались в PDF/Excel/CSV, метаданные экспорта сохраняются в логах.

Точность: 100% для факта экспорта, 0% для восстановления содержимого (если файл удалён).

Карвинг по нераспределённому пространству (для on-premise):

Поиск сигнатур удалённых файлов (.pbix,.twb).

Точность: 30-70% (зависит от перезаписи).

В кейсе №1 восстановление из бэкапов Power BI позволило сравнить метаданные «до» и «после» подделки. 💪

Глава 11. Противодействие анти-экспертным методам в BI-системах

Метод атаки	Техническая реализация	Контрмера эксперта
Изменение DAX/мер	Правка формул в Power BI Desktop, затем публикация поверх старой версии	Сравнение метаданных из бэкапов (Power BI API)
Экспорт данных через скрипт	API-вызовы export с правами администратора (Python, PowerShell)	Логи API, анализ CV, анализ User-Agent
Очистка Audit Log (Power BI)	DELETE через Microsoft Graph API (только для лицензий Premium)	Логи API (метод deleteAuditLog не всегда доступен, но проверяем)
Очистка Refresh Logs	Не предусмотрена в Power BI (логи хранятся 30 дней автоматически)	Но можно удалить workspace — тогда логи пропадут. Контрмера: бэкапы workspace
Подмена источника данных	Изменение строки подключения в метаданных отчёта	SQL-логи источника (не совпадают с ожидаемыми)
Скрипт с задержками	time.sleep(random.uniform(1,3))	Анализ CV (всё равно < 0.15 при массовых операциях)

Наша лаборатория постоянно обновляет контрмеры. Компьютерно-техническая экспертиза систем bi готова к любым уловкам. 🛡️⚔️

Глава 12. Типовые технические схемы нарушений в BI-системах

Анализ десятков экспертиз BI-систем позволяет выделить повторяющиеся технические схемы, которые инженер ищет в первую очередь: 🕵️‍♂️

Схема 1: «Фальсификация дашбордов перед сдачей отчётности».

Признаки: массовое изменение мер DAX/MDX за 1-3 дня до предоставления отчётности.

Обнаружение: сравнение метаданных из бэкапов за разные даты.

Схема 2: «Ночной экспорт данных через скрипт».

Признаки: экспорт отчётов в 02: 00-05: 00, CV < 0.15, User-Agent: python-requests.

Обнаружение: логи API, статистика.

Схема 3: «Фиктивное внедрение» (интеграторы).

Признаки: скрипты загрузки неоптимальны (Table Scan), reload в нерабочее время, не соответствует ТЗ.

Обнаружение: SQL-логи источника, логи обновления.

Схема 4: «Хищение коммерческой тайны через экспорт».

Признаки: массовый экспорт, очистка логов, ночные сессии с домашнего IP.

Обнаружение: логи API, логи экспорта, статистика.

Схема 5: «Сокрытие ошибок в дашбордах».

Признаки: удаление строк с отрицательными значениями в скриптах загрузки.

Обнаружение: сравнение числа строк в источнике и в BI-отчёте.

Эти схемы помогают эксперту быстро локализовать аномалии. 🧩

Глава 13. Метрологическое обеспечение: калибровка и тестирование

Для воспроизводимости результатов (требование ст. 8 Федерального закона № 73-ФЗ) применяется метрология: 📏🔬

Калибровка write-blockers (для on-premise): ежемесячно на эталонном диске с известными хешами.

Контрольные хеши (SHA-256) для всех выгруженных данных (логи, метаданные, образы).

Независимое дублирование — два эксперта анализируют одни и те же данные параллельно. Расхождения устраняются до выдачи заключения.

Тестовые наборы — синтетическая BI-система (10 дашбордов, 100 мер DAX, 2000 строк данных) с внесёнными искажениями (подделка мер, экспорт, удаление).

Точность методов > 99.9% (по результатам 1000 тестов).

Протоколы калибровки хранятся 5 лет и могут быть предоставлены суду по его запросу. 🎯

Глава 14. Технические ошибки при заказе экспертизы BI-систем

Инженерный взгляд на частые ошибки, которые допускают юристы и заказчики: 🚫🧠

Заказывают экспертизу слишком поздно — бэкапы BI-системы перезаписаны (30-90 дней), логи API удалены (в среднем хранятся 30-90 дней).

Не обеспечивают доступ к логам API — предоставляют только выгрузки из интерфейса (неполные, без скриптовых операций).

Игнорируют логи источников данных (SQL-логи) — ключевой источник для проверки корректности запросов.

Формулируют вопросы неконкретно — «Были ли подделаны дашборды?» вместо «Изменялись ли меры DAX в дашборде X в период Y?».

Экономят на экспертизе — использование нелицензионного ПО или неаттестованных экспертов ведёт к признанию заключения недопустимым доказательством.

Инженерный совет: заказывайте экспертизу немедленно после обнаружения нарушения, предоставляйте полный доступ к BI-системе (административный) и к источникам данных. 💰

Глава 15. Будущее компьютерно-технической экспертизы BI-систем

Мы не стоим на месте. В стадии разработки и внедрения находятся следующие инженерные направления: 🚀🔮

Нейросетевая детекция аномалий в DAX-формулах:

LSTM-модель, обученная на 10 000 легитимных DAX-выражений (из открытых источников и реальных дел).

Выявляет вредоносные изменения (например, SUMX → AVERAGEX без обоснования) с точностью > 96% (метрика F1).

Автоматическое построение графа зависимостей дашбордов:

Визуализация связей отчётов с источниками данных (таблицы, столбцы, меры).

Помогает быстро выявить, какие отчёты затронуты подделкой.

Блокчейн-депозитарий для хешей метаданных (Power BI, Tableau):

Неизменяемая фиксация хешей файлов.pbix,.twb на момент выгрузки.

Исключает подмену доказательств после экспертизы.

Анализ временных меток на уровне файловой системы (для on-premise):

Корреляция STANDARDINFORMATIONиSTANDARDINFORMATIONиFILE_NAME в MFT для обнаружения подделки времени создания отчётов.

Но основа остаётся неизменной: компьютерно-техническая экспертиза систем bi — это инженерная дисциплина, требующая глубоких знаний в области BI-платформ, SQL, статистики и криминалистики. Союз «Федерация судебных экспертов» следует этим принципам неукоснительно. 🧠⚖️

Заключение: инженерия побеждает хаос в BI-системах

BI-системы — Power BI, Tableau, Qlik, SAP BusinessObjects — агрегируют самые ценные данные бизнеса. Их подделка, несанкционированный экспорт или некачественное внедрение могут привести к налоговым доначислениям, хищению коммерческой тайны и многомиллионным убыткам. Но инженерный подход, вооружённый знанием метаданных, логов обновления, SQL-логов, статистики (CV, Z-тест) и методов восстановления, позволяет восстановить истинную картину. Три кейса, разобранные в статье, подтверждают: даже в самой защищённой BI-системе ложь оставляет следы. Вопрос только в том, кто умеет их читать.

Компьютерно-техническая экспертиза систем bi — это не услуга, это технология победы.

🟢 Переходите на сайт: https://kompexp.ru/
Там — форма заявки, контакты экспертов, примеры заключений. Звоните. Пишите. Приезжайте. Мы превратим ваши BI-данные в оружие победы.

Помните: в суде побеждает не тот, у кого правда, а тот, кто может её доказать с помощью инженерии. Мы поможем доказать. 🔥⚖️💪🔍🧠