АВТОМАТИЗАЦИЯ СМЕТНОГО НОРМИРОВАНИЯ В СТРОИТЕЛЬСТВЕ: ИНТЕГРАЦИЯ BIM-ТЕХНОЛОГИЙ И МЕТОДОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
Конференция: XCVII Международная научно-практическая конференция «Научный форум: технические и физико-математические науки»
Секция: Строительство и архитектура

XCVII Международная научно-практическая конференция «Научный форум: технические и физико-математические науки»
АВТОМАТИЗАЦИЯ СМЕТНОГО НОРМИРОВАНИЯ В СТРОИТЕЛЬСТВЕ: ИНТЕГРАЦИЯ BIM-ТЕХНОЛОГИЙ И МЕТОДОВ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
Введение
Переход строительной отрасли России к обязательному применению технологий информационного моделирования выявило: BIM-модели накапливают детальные сведения о геометрии, физических свойствах и составе конструкций, тогда как сметные системы по-прежнему требуют ручной интерпретации этих данных и трудоёмкой привязки к нормативным расценкам. Постановление Правительства РФ № 331 от 5 марта 2021 года распространило требования о ведении информационной модели объекта капитального строительства на застройщиков в сфере жилищного строительства — с 1 июля 2024 года для многоэтажного, с 1 января 2025 года для малоэтажного. По данным Минстроя РФ, к середине 2024 года лишь каждый пятый застройщик приступил к выполнению этих требований в установленные сроки. Сложности связаны не только с нехваткой квалифицированных кадров, но и с отсутствием отечественных программных инструментов, обеспечивающих бесшовный переход от информационной модели к готовому сметному расчёту.
Уход с российского рынка крупных зарубежных разработчиков в 2022 году обострил ситуацию: часть интеграционных решений, работавших через API иностранных платформ, стала недоступна, а отечественные аналоги пока не вышли на сопоставимый функциональный уровень. Разработка архитектуры, соединяющей отечественные BIM-платформы с модулями машинного обучения и нормативными базами данных, из теоретической переросла в производственную необходимость.
Состояние вопроса: существующие решения и их пределы
На отечественном рынке BIM-сметной интеграции представлены продукты 5D Смета, BIM-смета АВС, IYNO и BIM WIZARD («Визардсофт»). Во всех реализован один и тот же механизм: IFC-элементы привязываются к нормативным позициям через заранее заданные таблицы соответствия. В типовых ситуациях это работает, однако при нестандартных конструктивных решениях, изменениях нормативной базы или неполной параметризации модели таблицы систематически дают сбои.
Общий недостаток всех перечисленных продуктов — статичность правил соответствия: при выходе нового норматива таблицы приходится обновлять вручную. Контекст проекта при этом не учитывается — одна и та же конструкция в зависимости от климатического района или технологии возведения требует разных расценок, но система об этом не знает. Корректность результата прямо зависит от тщательности заполнения атрибутов BIM-модели, а дисциплина параметризации в большинстве проектных организаций остаётся невысокой.
Нейросетевые методы дают здесь ощутимые преимущества перед статичными правилами. Arafa и Alqedra (2018) продемонстрировали, что ансамблевые модели на основе глубоких сетей Больцмана прогнозируют стоимость жилых объектов с существенно меньшей погрешностью, чем традиционные регрессионные модели. Kim et al. (2023) показали, что глубокие нейронные сети, обученные на атрибутивных данных BIM-моделей, улучшают точность сметного прогноза примерно на 14,5% относительно классического регрессионного анализа. Zabin et al. (2023) установили, что DNN-архитектуры позволяют охватить около 94,7% исследуемых переменных при средней абсолютной процентной ошибке порядка 11,6%.
Концептуальная архитектура предлагаемой системы
Предлагаемая интегрированная система включает три взаимосвязанных функциональных уровня.
Уровень извлечения и предобработки данных отвечает за получение параметрической информации из IFC-файлов и BIM-платформ через открытые API. Здесь атрибуты элементов нормализуются, дубликаты устраняются, а отсутствующие значения восстанавливаются статистическим выводом из контекста модели.
Уровень интеллектуального сопоставления выполняет автоматическую привязку элементов модели к позициям ФЕР, ГЭСН и ТСН. Для этого применяется гибридный метод из трёх компонент: лексический поиск BM25 (k₁ = 1,5, b = 0,75) — для точного совпадения нормативной терминологии; семантический поиск Sentence-BERT + FAISS (IVFFlat, nlist = 256, recall = 0,971) — для преодоления лексического разрыва между произвольными наименованиями BIM-модели и стандартизированными описаниями ГЭСН; нечёткое сопоставление rapidfuzz (token_sort_ratio) — для обработки опечаток и аббревиатур. Агрегированная оценка релевантности вычисляется как взвешенная сумма нормализованных компонент с коэффициентами ω* = (0,50 ; 0,35 ; 0,15), оптимизированными байесовым методом на верифицированных парах.
Уровень формирования и верификации сметной документации агрегирует результаты интеллектуального сопоставления, применяет поправочные коэффициенты в зависимости от условий строительства и генерирует выходные документы в форматах, совместимых с отечественными сметными программами (Гранд-смета, RIK, WinSmeta).
Методы машинного обучения и обоснование их выбора
Привязка элементов BIM к сметным нормам устроена неоднозначно: несколько расценок могут быть равно применимы к одному элементу, а граница между ними меняется в зависимости от контекста объекта. Статичные правила классификации с этим не справляются — отсюда выбор в пользу трансформерных языковых моделей с семантическим поиском.
Для повышения точности сопоставления применяется механизм адаптивного дообучения на основе QLoRA (NF4-квантизация, LoRA rank = 8): языковая модель дообучается непосредственно в процессе эксплуатации на верифицированных специалистом-сметчиком парах «описание материала → нормативная позиция ГЭСН» без предварительной разметки корпуса. Метод обеспечивает рост точности P@1 с 69,4 % до 84,6 % при накоплении 2 000 верифицированных пар при снижении потребления VRAM в 2,6 раза относительно полного переобучения (0,7 ГБ против 1,8 ГБ).
Получаемые векторные представления позволяют сравнивать описания по смыслу, а не по точному совпадению слов — что важно, когда один и тот же конструктивный элемент в проектной документации обозначен иначе, чем в тексте сметного норматива.
Общий размер размеченного корпуса — 5 658 верифицированных пар «описание материала → нормативная позиция ГЭСН»: 4 758 пар использованы для оптимизации весовых коэффициентов гибридного метода (из них 3 806 обучающих / 952 валидационных) и 900 отложенных тестовых пар. Тестовая выборка не участвовала в подборе весов.
Заключение
Описанный гибридный метод прошёл проверку на корпоративном справочнике объёмом 101 750 позиций. BM25, Sentence-BERT + FAISS и rapidfuzz работают совместно через взвешенную функцию агрегации; единые весовые коэффициенты ω* = (0,50 ; 0,35 ; 0,15) оптимизированы байесовым методом на 4 758 верифицированных парах. Семишаговый конвейер нормализации (234 паттерна удаления служебных фрагментов, 847 паттернов нормализации аббревиатур, NER-извлечение атрибутов с F1 = 0,876) обеспечил прирост оценки BM25 в 1,77 раза; итоговая точность гибридного метода составила P@1 = 69,4 % на базе 101 750 позиций ФСНБ-2022, что статистически значимо превосходит лучший одиночный метод на 18,1 п.п.. После адаптивного дообучения (QLoRA, 2 000 верифицированных пар) точность возрастает до 84,6 %.
Ожидаемые результаты и направления дальнейших исследований
По данным хронометражного исследования производственного процесса в ООО «АЛЬФАСТРОЙ», ручная привязка расценок занимает 67,3 % рабочего времени специалиста-сметчика (35,2 из 55,0 рабочих часов на объект средней сложности). Автоматизация этой операции сопоставима по эффекту с введением дополнительной штатной единицы. Отдельная проблема — вариативность: два сметчика, работая с одним проектом независимо, нередко выбирают разные расценки, и на крупных объектах расхождение в итоговой стоимости может составлять 8–12 %. Машинный подбор устраняет эту непоследовательность. При обновлении нормативной базы в гибридной архитектуре достаточно переиндексировать корпус — переписывать правила не требуется.
Ближайшие задачи - расширение обучающего корпуса за счёт промышленных и транспортных объектов, разработка модуля RAG-генерации строк локального сметного расчёта и проверка переносимости системы на субъектные нормативные базы ТЕР.
Ограничения исследования
Результаты получены на корпоративном справочнике ООО «АЛЬФАСТРОЙ» (101 750 позиций, Московский регион). Для организаций с существенно иным составом номенклатуры или региональной спецификой ценообразования точность гибридного метода следует проверять независимо.
Апробация охватывает пять объектов: четыре жилых дома и школу. Точность сопоставления для других типов объектов может отличаться.
Применённая нормативная база — ФСНБ-2022. Перенос системы на другие редакции нормативов (ТЕР, ФЕРм, ресурсный метод) или на субъектные базы потребует переиндексации корпуса и дополнительной верификации весовых коэффициентов.


