ivdon3@bk.ru
Нельзя представить настоящее время без программного обеспечения. Огромные потоки информации проходят через компьютерные вычислительные системы. Совершенно невозможно обработать неструктурированные бесконечно поступающие данные, поэтому необходимо выделять конкретные задачи и подготавливать информацию к обработке. Одним из подобных действий является дедупликация. В данной статье рассматриваются возможные оптимизации метода удаления дубликатов с использованием баз данных.
Ключевые слова: дедупликация, база данных, поле, строка, текстовые данные, запрос, программное обеспечение, неструктурированные данные
В статье представлены способы повышения точности классификации нормативно-справочной информации при помощи алгоритмов иерархической кластеризации.
Ключевые слова: машинное обучение, искусственная нейронная сеть, сверточная нейронная сеть, нормативно-справочная информация, иерархическая кластеризация, DIANA
На сегодняшний день огромное количество разнородной информации проходит через электронные вычислительные системы. Возникает критическая необходимость в анализе нескончаемого потока данных ограниченными средствами, а это в свою очередь требует структурирования информации. Одним из этапов решения задачи упорядочивания данных является дедупликация. В данной статье рассматривается метод удаления дубликатов с использованием баз данных, анализируются результаты тестирования работы с различными типами систем управления баз данных с разными наборами параметров.
Ключевые слова: дедупликация, база данных, поле, строка, текстовые данные, искусственная нейронная сеть, множества, запрос, программное обеспечение, неструктурированные данные
В статье рассматривается подход к решению задачи оптимизации скорости агрегирующих запросов к непрерывному диапазону строк таблицы базы данных PostgreSQL. Создан программный модуль на базе расширения PostgreSQL Extensions, обеспечивающий построение дерева отрезков для таблицы и запросов к нему. Достигнуто увеличение скорости запросов более чем в 80 раз для таблицы размером 100 миллионов записей по сравнению с существующими решениями.
Ключевые слова: PostgreSQL, дерево отрезков, запрос, агрегация, оптимизация, PosgreSQL Extensions, асимптотика, индекс
1.2.2 - Математическое моделирование, численные методы и комплексы программ , 2.3.1 - Системный анализ, управление и обработка информации
Строительное производство связано с возникновением ряда негативных воздействий на окружающую среду. В статье рассмотрены основные виды строительных работ, сопровождающиеся основныи нагрузками на экологию. Особое внимание уделено проблеме строительного мусора, вариантам решения проблемы со свалкой. Варианты решения вопроса утилизации строительного мусора - сортировка, переработка. Экономические аспекты решения проблемы с утилизацией строительного мусора: эконолмия материалов, снижение количества отходов.
Ключевые слова: окружающая среда, негативное воздействие, строительное производство, утилизация, строительный мусор, переработка материалов
08.00.05 - Экономика и управление народным хозяйством (по отраслям и сферам деятельности)