{"title":"Проблемы и методы автоматической классификации текстовых документов","authors":"В. А. Яцко, V. Yatsko","doi":"10.36535/0548-0027-2021-11-4","DOIUrl":"https://doi.org/10.36535/0548-0027-2021-11-4","url":null,"abstract":"Представлен обзор основных проблем и методов автоматической классификации текстов. Рассматриваются такие темы, как: выбор исходного лингвистического материала; нейтрализация разницы в размерах текстов; применение дистантного и словарного подходов к классификации; уменьшение размерности текстов; создание словарей; адекватное взвешивание терминов; обучение и функционирование программы-классификатора. В доступной форме описываются процедуры выравнивания текстов по нижнему пределу и логарифмического выравнивания, алгоритмы вычисления косинусной меры близости, Z-коэффициента. Показаны особенности применения теоремы Байеса с целью частеречной классификации и фильтрации спама.","PeriodicalId":24076,"journal":{"name":"Научно-техническая информация. Серия 2: Информационные процессы и системы","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2021-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"88089569","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Обоснование показателей для управления научными достижениями","authors":"П.А. Калачихин, P. Kalachikhin","doi":"10.36535/0548-0027-2021-03-2","DOIUrl":"https://doi.org/10.36535/0548-0027-2021-03-2","url":null,"abstract":"Рассматривается проблема обоснования оптимального состава показателей, предназначенных для оценки достигнутых и прогнозирования новых научных достижений. Систематизируются типы показателей, которые обычно используются в управлении научными достижениями. Предлагается дифференцированный подход к выбору таких показателей в зависимости от разделов знания, к которым они относятся. Помимо наукометрических параметров разделов знания, перечисляются факторы, оказывающие влияние на формирование наборов показателей. Представлена разработка количественной модели соотношения типов показателей в составе их наборов на основе мер множеств и бинарных отношений порядка над числами. В рамках этой модели дается объяснение превалированию экспертных показателей. Решение о составе наборов показателей принимается на основании эвристических правил. Дается пример поиска оптимального соотношения типов показателей для прогнозирования достижений естественных наук и оценки достигнутых результатов гуманитарных наук.","PeriodicalId":24076,"journal":{"name":"Научно-техническая информация. Серия 2: Информационные процессы и системы","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2021-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"82721471","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Молекулярно-генетические алгоритмы кластеризации данных","authors":"И. В. Степанян, I. V. Stepanyan","doi":"10.36535/0548-0027-2021-01-1","DOIUrl":"https://doi.org/10.36535/0548-0027-2021-01-1","url":null,"abstract":"Проводятся два обобщения представленных ранее авторских алгоритмов, основанных на принципах кодирования информации в молекулярной генетике. Первое позволяет учитывать частотные характеристики суб-алфавитных представлений полинуклеотидов, второе - производить обработку произвольных данных, представленных в четверичном коде. Оба обобщения свидетельствуют о значении предлагаемых алгоритмов, которые автор назвал молекулярно-генетическими или ДНКалгоритмами, подчеркивая их различие с известными генетическими алгоритмами Холландского типа. Приведен пример отображения результатов работы ДНКалгоритмов в частотной области с визуализацией кластерной структуры информации, что дает возможность проследить достаточно распространенную для ДНК структуру, состоящую из основного кластера и нескольких кластеров-сателлитов. Проанализированы тексты на естественном языке (морфологический и фонетический анализ) с обработкой ДНК-алгоритмами в структурной и частотной областях.","PeriodicalId":24076,"journal":{"name":"Научно-техническая информация. Серия 2: Информационные процессы и системы","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2021-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"88790972","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Модель эффективного управления при формировании производственного портфеля","authors":"Л А Мыльников, L.А. Mylnikov","doi":"10.36535/0548-0027-2021-09-2","DOIUrl":"https://doi.org/10.36535/0548-0027-2021-09-2","url":null,"abstract":"Рассматриваются вопросы, связанные с генерацией и оценкой эффективности альтернативных решений при управлении портфелями проектов производственных систем (ПрС), а также алгоритмы генерации альтернативных портфелей проектов в условиях инвариантности их производства, комплектующих и материалов, построения и ранжирования траекторий развития ПрС с учётом состава портфеля проектов и требований по ресурсам и скорости развития этих систем. Предлагается система обозначений для описания процедурной модели управления портфелем проектов, которая может быть реализована алгоритмическими средствами.","PeriodicalId":24076,"journal":{"name":"Научно-техническая информация. Серия 2: Информационные процессы и системы","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2021-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"87834737","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Цифровые лингвистические информационные ресурсы. Определение объекта и каталогизация","authors":"Александр Борисович Антопольский, А.B. Antopolsky","doi":"10.36535/0548-0027-2021-03-4","DOIUrl":"https://doi.org/10.36535/0548-0027-2021-03-4","url":null,"abstract":"Обсуждается типология лингвистических информационных ресурсов (ЛИР), ставших важным инструментом прикладной лингвистики и информатики. Предлагается аналитический обзор международных организаций и проектов, специализирующихся в области ЛИР. Приводятся перечни зарубежных и российских каталогов, архивов и репозиториев ЛИР. Для развития ЛИР подчеркивается перспективность платформы связанных лингвистических открытых данных.","PeriodicalId":24076,"journal":{"name":"Научно-техническая информация. Серия 2: Информационные процессы и системы","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2021-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"80460421","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
А. В. Михайленко, А.V. Mikhailenko, Н.В. Шрейдер, N.V. Shreider, В. А. Ермолаев, V. Ermolaev, Дмитрий Александрович Рубан, D. Ruban
{"title":"Информационный анализ представленности женщин в советах директоров банков (по данным Scopus)","authors":"А. В. Михайленко, А.V. Mikhailenko, Н.В. Шрейдер, N.V. Shreider, В. А. Ермолаев, V. Ermolaev, Дмитрий Александрович Рубан, D. Ruban","doi":"10.36535/0548-0027-2021-12-3","DOIUrl":"https://doi.org/10.36535/0548-0027-2021-12-3","url":null,"abstract":"Международные исследования, посвященные представленности женщин в советах директоров банков, быстро развиваются, и рассмотрение существенной выборки публикаций позволяет обобщить их результаты. Информационный анализ содержания 104 статей, опубликованных в международных научных журналах, выявляет их тематическое разнообразие и позволяет установить тематические и географические пробелы в исследуемой теме.","PeriodicalId":24076,"journal":{"name":"Научно-техническая информация. Серия 2: Информационные процессы и системы","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2021-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"78363355","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Светлана Гавриловна Климова, S. G. Klimova, М.А. Михеенкова, М.А. Mikheyenkova, В.В. Руссович, V.V. Russovich
{"title":"Формализованная эвристика типологизации социума","authors":"Светлана Гавриловна Климова, S. G. Klimova, М.А. Михеенкова, М.А. Mikheyenkova, В.В. Руссович, V.V. Russovich","doi":"10.36535/0548-0027-2021-12-2","DOIUrl":"https://doi.org/10.36535/0548-0027-2021-12-2","url":null,"abstract":"Рассматриваются проблемы формализации исследовательских эвристик, используемых в процессе эмпирической типологизации социальных объектов или явлений. Для решения этих проблем используются средства ДСМ-метода автоматизированной поддержки исследований. Представлены результаты изучения помогающего поведения, в том числе различных форм корпоративного и индивидуального волонтёрства. Выявлены значимые различия в некоторых детерминирующих факторах помогающего поведения. Предложены рекомендации для социальной политики компаний в отношении волонтёрской деятельности сотрудников.","PeriodicalId":24076,"journal":{"name":"Научно-техническая информация. Серия 2: Информационные процессы и системы","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2021-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"84267087","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Ольга Леонидовна Голицына, О.L. Golitsina, А.С. Гаврилкина, А.S. Gavrilkina
{"title":"Об одном подходе к выделению имён сущностей и связей в задаче построения семантического поискового образа","authors":"Ольга Леонидовна Голицына, О.L. Golitsina, А.С. Гаврилкина, А.S. Gavrilkina","doi":"10.36535/0548-0027-2021-03-3","DOIUrl":"https://doi.org/10.36535/0548-0027-2021-03-3","url":null,"abstract":"Представлены методы и средства выделения имён сущностей и связей на основе лексико-синтаксических шаблонов в рамках задачи семантического индексирования текстов документов. Содержание текста рассматривается как совокупность отражаемых триплетами элементарных фактов, включающих имена сущностей и отношений (имманентных, ситуативных и структурно-лингвистических). Для типизации ситуативных отношений используется таксономия отношений, в которой классы включают лингвистические конструкции; имманентные отношения формируются на основе сети понятий (тезауруса). Для идентификации свойств сущностей используется таксономия свойств и единиц измерения. Предложенный подход позволяет использовать в качестве поискового запроса имена сущностей, имена отношений, а также элементарные факты и составленные из них завершённые смысловые конструкции.","PeriodicalId":24076,"journal":{"name":"Научно-техническая информация. Серия 2: Информационные процессы и системы","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2021-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"91505550","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
Сергей Григорьевич Черный, S. G. Chernyĭ, Алексей Николаевич Ивановский, А.N. Ivanovskii
{"title":"Применение теории линейной фильтрации для обработки данных (на примере определения осадки морского судна)","authors":"Сергей Григорьевич Черный, S. G. Chernyĭ, Алексей Николаевич Ивановский, А.N. Ivanovskii","doi":"10.36535/0548-0027-2021-11-3","DOIUrl":"https://doi.org/10.36535/0548-0027-2021-11-3","url":null,"abstract":"Представлен общий алгоритм решения задачи синтеза оптимального линейного фильтра, а также его программная реализация на языке Python для нахождения конечного значения осадки судна в морской практике, учитывая значение осадки величиной постоянной, а различного рода возмущения - шумом.","PeriodicalId":24076,"journal":{"name":"Научно-техническая информация. Серия 2: Информационные процессы и системы","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2021-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"87406465","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}
{"title":"Новый метод автоматической классификации текстовых документов","authors":"В. А. Яцко, V. Yatsko","doi":"10.36535/0548-0027-2021-06-5","DOIUrl":"https://doi.org/10.36535/0548-0027-2021-06-5","url":null,"abstract":"Описываются процедуры и особенности применения нового метода автоматической классификации документов, основанного на вычислении отклонений распределения стоп-слов от коэффициента Ципфа. С целью нейтрализации разниц в размерах текстов применена и описана методика их выравнивания по нижнему пределу. Введено понятие итеративного порогового уровня, позволяющее сократить размер текста до нескольких десятков терминов. Разработаны показатели дискриминирующей и симилирующей силы и вычисляемый на их основе обобщённый показатель. Проведено 14 тестов, включая сопоставление с косинусной мерой близости документов, которые показали высокую эффективность предлагаемого метода при решении задач авторской атрибуции художественных и кластеризации политических текстов.","PeriodicalId":24076,"journal":{"name":"Научно-техническая информация. Серия 2: Информационные процессы и системы","volume":null,"pages":null},"PeriodicalIF":0.0,"publicationDate":"2021-01-01","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"78594574","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}