Projects6rfbrl

ЗАЯВКА ПО ПРОЕКТУ 09-01-00721-а
Статус заявки:
не подписана
Дата последнего изменения: 14.09.2008
Изменения внес: Граничин Олег Николаевич
Заявка распечатана: 14.09.2008
ФОРМА 1. ДАННЫЕ О ПРОЕКТЕ
1.1.1. Название проекта:
Рандомизированные алгоритмы оценивания количества кластеров в множестве данных
1.1.2. Название проекта на английском языке:
Randomized algorithms of the data set clusters quantity estimation
1.2.1. Вид конкурса:
а - Инициативные проекты
1.2.2. Область знания:
01 - МАТЕМАТИКА, ИНФОРМАТИКА, МЕХАНИКА
1.3.1. Научная дисциплина - основной код:
01-203 Интеллектуальный анализ данных и распознавание образов

1.3.2. Научная дисциплина - дополнительные коды:
07-540 Системы интеллектуального анализа данных и распознавания образов

1.4. Ключевые слова:
кластеризация, устойчивость кластеризации, рандомизированные алгоритмы, стохастическая оптимизация, распознавание образов
1.5. Аннотация:
Кластеризация – одно из наиболее часто проявляющихся свойств разнообразных наборов данных, процессов, систем, широко используемое при решении многообразных задач обработки данных, в том числе при распознавании образов, машинном обучении, автоматической классификации, выработке стратегий управления, исследовании свойств ДНК, моделировании филогении организмов (кладистическом анализе), а также при сравнении элементов биоразнообразия. Итеративные методы кластеризации, которые обычно базируются на априорном задании количества кластеров и некотором выборе первоначального разбиения. При этом результат их применения существенно зависит от правильности оценки количества кластеров. Устойчивость кластеризации показывает, насколько различными получаются результирующие разбиения на группы после многократного применения алгоритмов кластеризации для одних и тех же данных.
Вычислительная сложность известных алгоритмов исследования устойчивости кластеризации существенно растет при увеличении мощности исследуемого множества данных и большинство из них недостаточно математически обоснованы. Снять эти трудности предлагается за счет использования рандомизированных алгоритмов, позволяющих дать адекватное математическое обоснование и сложность которых, как правило, не сильно растет с ростом размерности исходной задачи.
В ходе исследования будет предложен и математически обоснован новый рандомизированный подход к определению кластерной устойчивости.
1.6. Количество ученых - основных исполнителей:
7
1.7. Сроки выполнения:
2009-2011
1.8. Объем финансирования на 2009 год (в руб.):
450000
Подпись руководителя проекта:

ФОРМА 2. ДАННЫЕ О РУКОВОДИТЕЛЕ И ОСНОВНЫХ ИСПОЛНИТЕЛЯХ
2.1.1. Фамилия, Имя, Отчество:
Граничин Олег Николаевич

ФОРМА 4. СОДЕРЖАНИЕ ИНИЦИАТИВНОГО ПРОЕКТА
4.1. Фундаментальная научная проблема, на решение которой направлен проект:
Проект направлен на развитие методов кластеризации при анализе и обработке разнообразных данных с использованием современных достижений, в том числе новых рандомизированных алгоритмов, и на создание программных средств, включая новые веб-сервисы, демонстрирующих применимость новых методов в некоторых практических задачах.
4.2. Конкретная фундаментальная задача в рамках проблемы, на решение которой направлен проект:
В ходе работы над проектом будет исследована устойчивость современных методов кластеризации при анализе и обработке разнообразных обширных наборов данных, будет проведен анализ эффективности их применимости, выявлены общие закономерности, описаны сильные и слабые стороны методов. Результаты анализа будут положены в основу разработки нового рандомизированного метода оценивания количества кластеров в множестве данных, эффективность которого будет теоретически обоснована.
Для осуществления анализа и сравнения методов будут созданы тестовые базы данных, состоящие из объектов разной природы. В частности, базы данных векторов свойств, выделенных из слов речи, полученных в процессе оптического распознавания текстов и распознавания изображений, а также из таксономических признаков, выделяемых при классификации биологических объектов. Размещение баз данных будет проведено на серверах Санкт-Петербургского государственного университета. В результате работы над проектом предполагается создание доступного в Интернете демонстрационного программного продукта, который мог бы работать с исследуемыми и новыми алгоритмами как на заранее подготовленных данных, так и на данных, введенных пользователем. В частности, реализация проекта позволит уточнить наборы таксонов для действующих в Интернете многовходовых политомических определителей на основе разработанной ранее коллективом программы WebKeys-x [http://www.zin.ru/projects/webkey-x/index.html].
Решение описанной задачи окажет влияние на многие прикладные и фундаментальные научные исследования, базирующиеся на использовании тех или иных алгоритмов кластеризации.
4.3. Предлагаемые методы и подходы:
Для решения поставленных задач будут использованы методы системного анализа, стохастической оптимизации, статистической обработки данных и имитационного моделирования.
Будут проанализированы достоинства и недостатки следующих базовых подходов к определению количества кластеров в множестве данных, основанных на:
1) определяемых с помощью многомерных статистик индексов, сравнивающих степени «разброса» данных внутри кластеров и между кластерами;
2) расчете значений эвристических характеристик (функций устойчивости), показывающих соответствие назначенных кластеров для выборочных элементов множества;
3) статистиках, определяющих наиболее вероятное решение;
4) оценивании плотностей распределений.
На начальной стадии по результатам проведения серий имитационных экспериментов с тестовыми базами данных, имеющими различные характеристики, для каждого из подходов будут сформированы предположения о той или иной степени регулярности результатов расчетов, будут экспериментально установлены наиболее эффективные алгоритмы оценки количества кластеров для разных наборов данных. Для этого, в частности, будет сформирована специальная функция качества работы алгоритма (типа функционала среднего риска).
На следующей стадии исследования, в зависимости от полученных результатов, предполагается обоснование выбора того или иного рандомизированного алгоритма стохастической оптимизации для последовательной оценки количества кластеров. В случае выпуклости функции качества будет использоваться алгоритм типа SPSA (simultaneously perturbation stochastic approximation), в других – алгоритмы отжига или гинетические.
Оценив количество кластеров, можно использовать как широко известные методы кластеризации (например, k-means), так и достаточно новые рандомизированные алгоритмы типа SPSA.
Итоговый новый алгоритм кластеризации будет предложен как комбинация двух рекуррентных алгоритмов параллельного оценивания количества кластеров и множеств кластеризации, позволяющий уточнять результаты в режиме on-line при поступлении новых данных.
Далее будет проведено теоретическое обоснование эффективности использования нового алгоритма, основанное на математических методах.
Общие теоретические исследования будут подкреплены разработкой специализированного программного обеспечения для демонстрации применимости новых алгоритмов на тестовых примерах из базы данных, либо на загружаемых пользователями данных.
В частности, на основе новых методов будет предложен близкий к оптимальному метод классификации биологических объектов. Эта задача является NP-полной (Вахитов, Граничина, 2006), и при реалистичном объеме таксономических данных поиск оптимального решения вычислительно невыполним, однако на базе устойчивой кластеризации размерность задачи будет существенно понижена и это позволит найти оптимальное решение не для самих таксонов, а для их кластеров.
На протяжении всего проекта как экспериментальная часть исследований, так и итоговое программного обеспечение будут разрабатываться на современной платформе с использованием JAVA-технологий, интерфейсы взаимодействия будут выполнены как веб-сервисы.

2009 г. – Исследование существующих методов определения количества кластеров. Эксперименты с реализацией методов. Подготовка базы данных тестовых множеств. Выделение векторов свойств из слов речи, изображений, отсканированных текстов. Подготовка таксономических данных, полученных при анализе биологических коллекций. Формулировка и обоснование новых методов определения количества кластеров. Апробация существующих и новых методов кластеризации на базе данных тестовых множеств. Эксперименты с новым методом кластеризации. Отладка интеграции с разработанной ранее программой WebKey-x, создание баз данных по диагностическим признакам отдельных групп.
2010 г. – Совершенствование новых методов. Расширение базы данных тестовых множеств. Создание демонстрационной программы на основе наиболее производительных методов определения количества кластеров с использованием как перечисленных выше тестовых множеств, так и произвольных, задаваемых пользователем в определенном формате. Совершенствование методов диагностики биоразнообразия и создание политомических ключей для отдельных групп животных, а также баз таксономических данных и матриц признаков для определителей.
2011 г. – Завершение разработки демонстрационной программы. Исследование возможностей применения новых методов в других областях. Отработка возможности пользователю полностью самостоятельно исследовать эффективность предложенных методов на своих тестовых данных. Размещение демонстрационной программы, документации и автономного сервиса для определения наилучшего количества кластеров по тестовым данным в сети Интернет. Размещение в Интернете ключей по разработанным в ходе выполнения проекта группам животных, а также анализ и оптимизация сетевых компонентов системы в Интернете.
4.4. Ожидаемые в конце 2009 года научные результаты:
Будет произведен анализ существующих методов определения количества кластеров и подготовлен отчет об их характеристиках, достоинствах и недостатках. Будет сформулирован и обоснован новый рандомизированный рекуррентный метод определения количества кластеров. Будет проведена серия имитационных сравнительных экспериментов с новым и существующими методами кластеризации. Будет отлажена интеграция с разработанной ранее программой WebKey-x, будет продолжено развитие имеющихся баз данных, созданы новые базы данных по диагностическим признакам отдельных групп. По материалам исследований будут подготовлены 2 статьи в научные журналы, а сами материалы доложены на различных научных форумах российского и международного уровней.
4.5. Современное состояние исследований в данной области науки, сравнение ожидаемых результатов с мировым уровнем:
Кластеризация – одно из наиболее часто проявляющихся свойств разнообразных наборов данных, процессов, систем, широко используемое при решении многообразных задач обработки данных, в том числе при распознавании образов, машинном обучении, автоматической классификации, выработке стратегий управления, исследовании свойств ДНК, моделировании филогении организмов (кладистическом анализе), а также при сравнении элементов биоразнообразия.
В настоящее время алгоритмы кластеризации данных активно развиваются. В процессе кластеризации множество данных разбивается на группы. Принадлежность к группе математически обычно определяется с помощью функций (метрик), которые задают критерий схожести объектов.
Итеративный процесс кластеризации обычно состоит из двух стадий: разбиение на группы и определение качества разбиения. Результатом кластеризации является разбиение с наилучшим качеством.
В научных исследованиях и практических разработках массово применяются итеративные методы кластеризации, которые обычно базируются на априорном задании количества кластеров и некотором выборе первоначального разбиения. При этом качество результатов их применения существенно зависит от правильности оценки количества кластеров. Устойчивость кластеризации показывает, насколько различными получаются результирующие разбиения на группы после многократного применения алгоритмов кластеризации для одних и тех же данных. Небольшое расхождение результатов интерпретируется как высокая устойчивость. Количество кластеров, которое максимизирует кластерную устойчивость, может служить хорошей оценкой для реального количества кластеров.
К настоящему времени известно несколько апробированных подходов к исследованию устойчивости кластеризации.
Dunn, Hubert and Schultz (C-index), Calinski-Harabasz, Hartigan , Krzanowski-Lai, Sugar- James, Gordon, Milligan and Cooper определяют количество классов (кластеров) на основе некоторых индексов.
Levine и Domany, Ben-Hur, Elisseeff и Guyon измеряют устойчивость кластеризации с помощью соотношения количества раз, когда пара элементов множества, принадлежащая одному кластеру до применения алгоритма кластеризации, оставалась в том же кластере после завершения работы алгоритма.
Bel Mufti, Bertrand и El Moubarki определяют функцию устойчивости кластеризации на основе измерения изоляций Ловингера.
Метод Clest (Dudoit, Fridlyand) использует индекс корреляции внешнего разбиения в качестве измерения устойчивости.
Roth, Lange, Braun и Buhmann предлагают метод, в котором сравниваются пары кластеризованных данных. Устойчивость определяется как соотношение количества раз, когда элемент попал в один и тот же кластер.
Jain и Moreau использовали дисперсии эмпирических распределений в качестве измерения устойчивости.
Другой метод определения количества кластеров связан с оценкой основной плотности подмножества Евклидова пространства (Wishart, Hartigan). Вводится понятие кластеров высокой плотности. Количество кластеров определяется как общее число непересекающихся областей, чьи плотности превышают заданное значение.
Общим недостатком перечисленных методов является то, что вычислительная сложность алгоритмов существенно растет при увеличении мощности исследуемого множества данных и, кроме того, большинство из них недостаточно математически обоснованы. Частое скачкообразное поведение тестовых данных, а также ограничения алгоритмов кластеризации приводят к возникновению шумов и потере информации. Чтобы избежать этого, как правило, производят большее количество итераций, что значительно повышает вычислительную сложность процесса кластеризации.
Известно, что в других приложениях снять эти трудности позволяет использование рандомизированных алгоритмов, позволяющих дать адекватное математическое обоснование и сложность которых, как правило, не сильно растет с ростом размерности исходной задачи (Поляк, Щербаков, Campi, Tempo, Galafiori и др.). Кроме того, эффективность процесса кластеризации может быть улучшена при использовании рандомизированных алгоритмов стохастической оптимизации (типа SPSA) и за счет того, что они при небольших вычислительных затратах на каждой итерации обеспечивают сходимость при почти произвольных помехах.
Диагностика и анализ биоразнообразия в условиях лавинообразно увеличивающихся данных становятся все более и более трудными. Последние десятилетия для этого все шире и шире используются возможности компьютеров и веб-технологий. Многие определители и таблицы в Интернете представлены электронными версиями традиционных одновходовых таблиц. Политомические многовходовые ключи получили в последние десятилетия новый мощный импульс для развития в связи с использованием компьютерных технологий и Интернета, однако используемое программное обеспечение пока еще не соответствует масштабности необходимой диагностики. К настоящему времени полные аналоги созданной ранее коллективом программы WebKey-x в Интернете отсутствуют, однако создано несколько перспективных программ, реализующих компьютерные интерактивные многовходовые ключи [IdentifyIt (Linnaeus II) - F. MacIntyre & K. Estep, Netherlands; INTKEY (DELTA) - M. Dallwitz & R. Payne, Australia; LUCID - K. Thiele & G. Rutter, Australia; LYSANDRA - K. Dovgailo, A. Osipov & A. Shumeiko, Belarus; MEKA - C. Meacham, USA; PICKEY (BIKEY) - M. Dianov & A. Lobanov, Russia; TAXEX - E. Butakov & S. Lelekov, Ukraine]. Первые попытки создания многовходовых интерактивных определителей насекомых в Интернете предприняты на сайте "Critical Trend Assesment Program" [C. Dietrich, D.M. Takiya, D.A. Dmitriev - http://ctap.inhs.uiuc.edu]. Однако весьма существенным недостатком этих определителей является то, что в них не учитывается диагностическая ценность используемых признаков и все они предназначены лишь для небольших массивов данных. Этот недостаток позволяет устранить система WebKey-x, но ее применимость сдерживается недостаточной проработанностью наборов таксонов.

В ходе исследования предполагается детально проанализировать уже использующиеся методы и, обобщив результаты, предложить и математически обосновать новый рандомизированный подход к определению кластерной устойчивости.
Успешное выполнение проекта позволит получить новые научные результаты мирового уровня как теоретические, так и практические.
4.6. Имеющийся у коллектива научный задел по предлагаемому проекту: полученные ранее результаты:
Научный задел коллектива базируется на фундаменте известной во всем мире научной школы В.А.Якубовича и В.Н.Фомина, которые еще в 60-70-е гг. прошлого века внесли существенный вклад в создание теоретических основ современных теорий распознавания образов и кластеризации. Первые научные работы руководителя проекта Граничина О.Н. были выполнены в начале 80-х гг. под руководством проф. В.Н.Фомина и практически все они имели прямое отношение к тем или иным аспектам задачи о выделении классов в наборах данных и дальнейшем использовании полученной информации в алгоритмах оптимизации или адаптивного управления.

В 90-х гг. прошлого века Граничиным О.Н., Поляком Б.Т., Цыбаковым А.Б. и J.Spall были предложены, обоснованы и детально исследованны новые рекуррентные рандомизированные алгоритмы стохастической оптимизации (в англоязычной литературе SPSA, simultaneously perturbation stochastic approximation), которые при своей вычислительной простоте обеспечивают состоятельность последовательности получаемых на каждом шаге оценок при почти произвольных помехах в наблюдении. Кроме того, они (как было показано в работах Поляка Б.Т. и Цыбакова А.Б.) обладают свойством оптимальности в том смысле, что для широкого класса похожих задач невозможно предложить алгоритмы, обеспечивающие более высокий порядок скорости сходимости последовательности оценок.

В 2003 году в монографии "Рандомизированные алгоритмы оценивания и оптимизации при почти произвольных помехах" (Граничин О.Н., Поляк Б.Т. М.: Наука. 2003. 291 с.) был предложен простой с вычислительной точки зрения рандомизированный алгоритм типа SPSA для автоматического разбиения множества данных на заданное заранее количество классов. Теоретического обоснования алгоритма дано не было. В монографии О.Н.Граничина и Б.Т.Поляка основное внимание было уделено теоретическому обоснованию общих алгоритмов типа SPSA, которое было продолжено в следующих работах (Granichin O.N. Linear regression and filtering under nonstandard assumptions (Arbitrary noise) // IEEE Trans. on AC, v.49, oct. 2004, pp.1830-1835; Вахитов А.Т., Граничин О.Н., Сысоев С.С. Точность оценивания рандомизированного алгоритма стохастической оптимизации // Автоматика и телемеханика, 2006, № 4 , с.86-96).
В работе Граничина О.Н. и Измаковой О.А. (Рандомизированный алгоритм стохастической аппроксимации в задаче самообучения // Автоматика и телемеханика, 2005, № 8, с. 52-63) предложенный ранее алгоритм для автоматической классификации был модернизирован и теоретически обоснован в новом виде.

Шалымовым Д.С. рандомизированные алгоритмы стохастической аппроксимации были успешно применены в задаче дикторонезависимого распознавания речи (Шалымов Д.C. Рандомизированный алгоритм стохастической аппроксимации в задаче распознавания отдельных слов речи // В сб. «Стохастическая оптимизация в информатике» под ред. О.Н. Граничина. Изд-во С.-Петерб. ун-та. 2006. Вып. 2; Granichin O. N., Shalymov D. S., Speaker-Independent Isolated Words Recognition Problem Solving Based On Simultaneous Perturbation Stochastic Approximation Algorithm, Yalta Conf. on Discrete and Global Optimization, 2008). Удалось добиться высокой степени точности распознавания при небольших затратах вычислительных ресурсов. Также новые рандомизированные методы разбиения на классы были апробированы для распознавания арабских печатных текстов (Шалымов Д.C. Автоматическое распознавание печатных текстов арабского языка // В сб. «Стохастическая оптимизация в информатике» под ред. О.Н. Граничина. Изд-во С.-Петерб. ун-та. 2006. Вып. 3). В следующей работе (Шалымов Д. С. Методы стохастической оптимизации в задаче распознавания печатных текстов арабского языка // В сб. трудов пятой международной научно-практической конференции "Исследование, разработка и применение высоких технологий в промышленности". 2008. С. 140-142) описаны разработанные методы выделения векторов свойств для печатных символов арабского языка, которые могут быть использованы для формирования базы данных тестовых множеств.

Решение задачи классификации биологических видов на основе описаний таксонов было приведено в работах (Лобанов А.Л., Кирейчук А.Г., Смирнов И.С., Граничин О.H., Вахитов А.Т., Дианов М.Б. К реализации идеального интерактивного определителя биологических объектов в интернете // В сб. тр. Всерос. научн. конф. «Научный сервис в сети Интернет: технологии параллельного программирования» (18-23 сентября 2006 г., г. Новороссийск) М. 2006; Лобанов А. Л., Кирейчук А. Г., Вахитов А. Т., Граничин О. Н. Алгоритмы построения вопросника минимальной длины для биологического определителя в Интернет и успехи в их реализации // В сб. тр. Всерос. научн. конф. «Научный сервис в сети Интернет: многоядерный компьютерный мир» (24-29 сентября 2007 г., г. Новороссийск). М. 2007), в которых также был описан разработанный ранее исполнителями программный комплекс (средство заполнения баз данных, классификатор в Интернете, http://apps.zin.ru/webkey), применимый и в предлагаемом новом исследовании. Среди исполнителей проекта есть известные специалисты по разным группам животных, опубликовавшие более 200 научных статей и монографий по систематике и филогенетике, в том числе определители и ревизии, описания около 500 новых таксонов ранга инфраотряда, надсемейства, семейства, рода и вида (Кирейчук (Kirejtshuk), 1979-2008; Kurochkin & Kirejtshuk, 2003, 2005, 2006 и др.), в том числе и в работе с ископаемыми объектами (Кирейчук, Пономаренко, 1990; Kirejtshuk, 2002, 2005; Kirejtshuk & Poinar, 2006, Bily & Kirejtshuk, 2007, Кирейчук, Пойнар, 2007; Kirejtshuk, Kurochkin, Monteiro, 2007; Poinar & Kirejtshuk, 2008; Кирейчук, 2008 и др.). Исполнители проекта многие годы разрабатывают технологии использования компьютеров для определения организмов, в том числе создали программное обеспечение для генерации гипертекстовых страниц на сайтах сервера ЗИН РАН и для создания многовходовых политомических ключей (Лобанов, 1972; Лобанов, 1974; Лобанов, 1975а; Лобанов, 1975б; Лобанов, 1983; Лобанов, Степаньянц, 1993; Лобанов, Дианов, 1994; Лобанов и др., 1995; Дианов, Лобанов, 1997; Лобанов и др., 2002; Lobanov et al., 1981; Lobanov et al., 1996; Lobanov, 1997; Dianov & Lobanov, 1997, Lobanov & Ryss, 1999). В результате исполнителями ранее была разработана модель идеального на настоящее время интерактивного определителя, которая в значительной мере нашла свое воплощение в программе WebKey-x [http://www.zin.ru/projects/webkey-x/index.html], созданной при поддержки РФФИ (грант N 05-07-90179) и на основе которой уже работают в Интернете политомические многовходовые ключи для некоторых жуков и арктических офиур.
4.7.1. Список основных публикаций коллектива, наиболее близко относящихся к предлагаемому проекту:
Граничин О.Н., Поляк Б.Т. "Рандомизированные алгоритмы оценивания и оптимизации при почти произвольных помехах" М.: Наука. 2003. 291 с.
Fedin D. S., Granichin O. N., Dedkov Yu. S., Molodtsov S. L. Method of measurements with random perturbation: Application in photoemission experiments // Review of Scientific Instruments. 79, 036103. 2008.
Граничин О.Н., Шалымов Д. С. Решение задачи автоматического распознавания отдельных слов речи при помощи рандомизированного алгоритма стохастической аппроксимации // Нейрокомпьютеры: разработка, применение, 2008, № 7.
Граничин О.Н., Краснощеков В.Е. Алгоритмы оптимизации энергопотребления в мобильных устройствах // Нейрокомпьютеры: разработка, применение, 2007, № 6.
Вахитов А.Т., Граничин О.Н., Сысоев С.С. Точность оценивания рандомизированного алгоритма стохастической оптимизации // Автоматика и телемеханика, 2006, № 4 , с. 86-96.
Граничин О.Н., Жувикина И.А. Новая модель процесса вычислений: обобщение концепции машины Тьюринга // Нейрокомпьютеры: разработка, применение, 2006, № 7 , с. 24-31.
Granichin O.N., Vakhitov A.T. Accuracy for the SPSA algorithm with two measurements // WSEAS Transactions on Systems. № 5. v. 5. May 2006. pp. 953-957.
Granichin O.N. Linear regression and filtering under nonstandard assumptions (Arbitrary noise) // IEEE Trans. on AC, v.49, oct. 2004, pp. 1830-1835.
Граничин О.Н., Измакова О.А. Рандомизированный алгоритм стохастической аппроксимации в задаче самообучения // Автоматика и телемеханика, 2005, № 8, с. 52-63.
Граничин О.H., Хантулева Т.А. Гибридные системы и рандомизированные измерения в неравновесных процессах // Differential equations and control processes, № 3, 2004, Electronic Journal, reg. № P23275 at 07.03.97
Граничин О.Н. Оптимальная скорость сходимости рандомизированных алгоритмов стохастической аппроксимации при произвольных помехах // Автоматика и телемеханика, 2003, № 2, с. 88-99.
Граничин О.Н. Неминимаксная фильтрация при неизвестных ограниченных помехах в наблюдениях // Автоматика и телемеханика, 2002, № 9, с. 125-133.
Граничин О.Н. Рандомизированные алгоритмы стохастической аппроксимации при произвольных помехах // Автоматика и телемеханика, 2002, № 2, с. 44-55.
Граничин О.Н. Оценивание параметров линейной регрессии при произвольных помехах // Автоматика и телемеханика, 2002, № 1, с. 30-41.
Граничин О.Н. Построение дискретного субоптимального регулятора непрерывного объекта с нерегулярной ограниченной помехой // Автоматика и телемеханика, 2001, № 3, c. 86-94.
Граничин О.Н. Процедура стохастической аппроксимации с возмущением на входе // Автоматика и телемеханика, 1992, № 2, с. 97-104.
Граничин О.Н. Оценивание точки минимума неизвестной функции, наблюдаемой на фоне зависимых помех // Проблемы передачи информации, 1992, № 2, с. 16-20.
Граничин О.Н. Построение субоптимального регулятора линейного объекта с ограниченной помехой // Автоматика и телемеханика, 1990, № 2, c. 59-62.
Граничин О.Н. Об одной стохастической рекуррентной процедуре при зависимых помехах в наблюдении, использующей на входе пробные возмущения // Вестник Ленингр. ун-та, сер.1, 1989, вып.1(4), с. 19-21.
Граничин О.Н. Алгоритм стохастической аппроксимации с возмущением на входе для идентификации статического нестационарного дискретного объекта // Вестник Ленингр. ун-та, cер.1, 1988, вып.3(15), с. 92-93.
Граничин О.Н., Фомин В.Н. Адаптивное управление с использованием пробных сигналов // Автоматика и телемеханика, 1986, № 2, с. 100-112.
Граничин О.Н., Фомин В.Н. Метод динамического программирования в задаче минимаксного управления // Вестник Ленингр. ун-та, cер.1, 1986, вып.1, с. 26-30.
Барабанов А.Е., Граничин О.Н. Оптимальный регулятор линейного объекта с ограниченной помехой // Автоматика и телемеханика, 1984, № 5, c. 39-46.
Kirejtshuk A.G. On the fauna of Nitidulidae (Coleoptera, Nitidulidae) from Taiwan with some taxonomical notes // Annales Historico-Naturales Musei Nationalis Hungarici, 2005, Vol. 97: 217-279.
Kirejtshuk A.G. Notes on the systematics of the African Nitidulidae (Coleoptera) // Annales Historico-Naturales Musei Nationalis Hungarici, 2001, Vol. 93: 17-89.
Kirejtshuk A.G. Nitidulidae (Coleoptera) of the Himalayas and Northern Indochina. Part 1: subfamily Epuraeinae. Koeningstein, Koeltz Scientific Books (Theses Zoologicae, Vol. 28). 1998: 1-489.
Шалымов Д. С. Дикторонезависимое распознавание речи при помощи рандомизированного алгоритма стохастической аппроксимации // В сб. трудов пятой международной научно-практической конференции "Исследование, разработка и применение высоких технологий в промышленности". 2008. C. 131-138.
Шалымов Д. С. Методы стохастической оптимизации в задаче распознавания печатных текстов арабского языка // В сб. трудов пятой международной научно-практической конференции "Исследование, разработка и применение высоких технологий в промышленности".
2008. С. 140-142.
Shalymov D. S. Noise Robust Isolated Words Recognition Problem Solving Based On Simultaneous Perturbation Stochastic Approximation Algorithm // The 20th Int. Conf. "Continuous Optimization and Knowledge-Based Technologies". PP.112-118. 2008.
Granichin O. N., Shalymov D. S. Speaker-Independent Isolated Words Recognition Problem Solving Based On Simultaneous Perturbation Stochastic Approximation Algorithm // Yalta Conf. on Discrete and Global Optimization. 2008.
Шалымов Д.C. Автоматическое распознавание печатных текстов арабского языка // В сб. «Стохастическая оптимизация в информатике» под ред. О.Н. Граничина. Изд-во С.-Петерб. ун-та. 2006. Вып. 3.
Вахитов А.Т. Адаптивное слияние результатов поиска изображений по содержанию // В сб. «Стохастическая оптимизация в информатике» под ред. О.Н. Граничина. Изд-во С.-Петерб. ун-та. 2007. Вып. 3.
Granichin O.N., Shalymov D. New breed stochastic hybrid computers // In: Proc. of the 3-rd International IEEE Scientific Conference on Physics and Control (PhysCon 2007), Potsdam, Germany, September 3-7, 2007. P. 178
Granichin O.N., Vakhitov A.T. Architecture for artificial intelligence hybrid computing // In: Proc. of the 3rd International IEEE Scientific Conference on Physics and Control (PhysCon 2007), Potsdam, Germany, September 3-7, 2007. P.181.
Granichin O.N., Vakhitov A.T. SPSA-Based Adaptive control: accuracy of estimates // In: Proc. of the 9TH IFAC Workshop “Adaptation and Learning in Control and Signal Processing” (ALCOSP), St. Petersburg, Russia, August 29-31, 2007. P. 51
Лобанов А. Л., Кирейчук А. Г., Вахитов А. Т., Граничин О. Н. Алгоритмы построения вопросника минимальной длины для биологического определителя в Интернет и успехи в их реализации // В сб. тр. Всерос. научн. конф. «Научный сервис в сети Интернет: многоядерный компьютерный мир» (24-29 сентября 2007 г., г. Новороссийск). М. 2007.
Вахитов А.Т., Граничина O.А. Алгоритмы классификации за минимальное число шагов // В сб. «Стохастическая оптимизация в информатике» под ред. О.Н. Граничина. Изд-во С.-Петерб. ун-та. 2006. Вып. 2.
Вахитов А.Т. Методы балансировки загрузки для многопроцессорных систем // В сб. «Стохастическая оптимизация в информатике» под ред. О.Н. Граничина. Изд-во С.-Петерб. ун-та. 2006. Вып. 2.
Шалымов Д.C. Рандомизированный алгоритм стохастической аппроксимации в задаче распознавания отдельных слов речи // В сб. «Стохастическая оптимизация в информатике» под ред. О.Н. Граничина. Изд-во С.-Петерб. ун-та. 2006. Вып. 2.
Лобанов А.Л., Кирейчук А.Г., Смирнов И.С., Граничин О.H., Вахитов А.Т., Дианов М.Б. К реализации идеального интноактивного определителя биологических объектов в интернете // В сб. тр. Всерос. научн. конф. «Научный сервис в сети Интернет: технологии параллельного программирования» (18-23 сентября 2006 г., г. Новороссийск), М. 2006. С. 202-204.
Лобанов А.Л., Кирейчук А.Г., Смирнов И.С., Дианов М.Б., Граничин О.H. Интернет и интерактивные определители биологических объектов // В сб. тр. Всерос. научн. конф. «Научный сервис в сети Интернет: технологии распределенных вычислений» (19-24 сентября 2005 г., г. Новороссийск). М. 2005. С. 132-134.
Лобанов А.Л. Логический анализ и классификация существующих форм диагностических ключей // Энтомол. обозр. 1972. Т. 51 (3): 668-681.
Лобанов А.Л. Результаты экспериментов с биологическими диагностическими системами на базе ЭВМ "Hаири-С". Биологические исследования на Северо-Востоке Европейской части СССР // Ежегодник Института биологии Коми филиала АH СССР. Сыктывкар. 1975. 162-168.
Лобанов А.Л. Математический аппарат для расчета, оценки и сравнения конструктивных параметров диагностических ключей // Зоол. журн. 1975. Т. 54 (4): 485-497.
Лобанов А.Л. Принципы построения определителей насекомых с использованием электронных вычислительных машин. - Автореферат диссертации на соискание ученой степени канд. биол. наук. Л.: ЗИH АH СССР, 1983. 19 c.
Лобанов А.Л., Дианов М.Б. Диалоговая компьютерная диагностическая система BIKEY и возможности ее использования в энтомологии // Энтомол. обозр. 1994. Т. 73 (2): 465-478.
Лобанов А.Л., Смирнов И.С. Место и роль информационных технологий в исследованиях Зоологического института РАН // Фундаментальные зоологические исследования: Теория и методы. (По материалам Международной конференции «Юбилейные чтения, посвященные 170-летию Зоологического института РАН», проходившей 23-25 октября 2002 г.), М.-СПб.: Товарищество научных изданий КМК. 2004. 283-318.
Лобанов А.Л., Смирнов И.С., Дианов М.Б., Алимов А.Ф., Кирейчук А.Г., Кривохатский В.А. 2002. Российские зоологические базы данных в Интернете // Труды Всероссийской научной конференции "Научный сервис в сети ИНТЕРНЕТ", г. Новороссийск, 23-28 сентября 2002 г. М.: Изд-во Московского университета, 2002. 51-53.
Лобанов А.Л., Степаньянц С.Д. Оптимизация определителя семейств медуз подотряда Filifera (Hydrozoa, Athecata) с помощью компьютерной диагностической системы. Морской планктон. Систематика, экология, распределение. 2 // Исследования фауны морей. Вып. 45 (53). 1993. 38-50.
Лобанов А.Л., Степаньянц С.Д., Дианов М.Б. BIKEY - диалоговая компьютерная программа для определения биологических объектов и ее использование в диагностике книдарий // В кн.: Книдарии. Современное состояние и перспективы исследований. 2 (Труды Зоологического института. Т. 261). 1995. 20-70.
Vershik A., Granichina O. Reduction non-holonomical variation problems to isoperimetric problems // Math. Notes 49, n.5-6. 1991.
Бордовский Г.А., Граничина О.А., Трапицын С.Ю. Модели и методы внешнего и внутреннего оценивания качества образования в вузах. Научно-методические материалы «Междисциплинарные исследования и гуманитарные технологии». – СПб: Изд-во ООО «Книжный дом». 2008.
Граничина О.А. Рандомизированные алгоритмы оптимизации при контро-ле качества в образовательном процессе // Стандарты и качество. – М.: Изд-во РИА. 2006. №8.
Граничина О.А., Трапицын С.Ю. Построение модели системы комплексного оценивания качества деятельности вуза с использованием процессного подхода // Известия РГПУ им. А.И.Герцена. Сер. Общественные и гума-нитарные науки.– СПб. 2007. № 9(50).
Граничина О.А. Использование современных квалиметрических методов при оценке качества образования в вузе // Известия РГПУ им. А.И. Герцена. Сер. Общественные и гуманитарные науки. – СПб. 2008. №11/75.
Граничина О.А., Комаров С.Н., Терехов А.Н. Интегрировано-распределенная автоматизированная информационная система для круп-ного научно-образовательного учреждения. – СПб.: Вестник СПбГУ. Сер. 10. 2008. Вып.1.
Граничина О.А., Трапицын С.Ю. Технологии организации и проведения мониторинга качества педагогического образования // Известия Волго-градского государственного педагогического университета. – Волгоград. 2008.
Chuyko D., Granichin O., Sysoev S. Simulation of rare events and probability estimation // In: Proc. of the 5-th St. Petersburg Workshop on Simulation, St. Petersburg, 2005, pp. 215-220.
Волкович Я.В., Граничин O.Н. Адаптивная оптимизация сервера, обрабатывающего очередь заданий // В сб. «Стохастическая оптимизация в информатике» под ред. О.Н. Граничина. Изд-во С.-Петерб. ун-та. 2005. Вып. 1. С. 17-28.
Граничин О.Н., Халидов В.И. Рандомизированный подход к обнаружению разрывов функции // В сб. «Стохастическая оптимизация в информатике» под ред. О.Н. Граничина. Изд-во С.-Петерб. ун-та. 2005. Вып. 1. С. 73-80.
Граничин О.H. Оценивание параметров динамических процессов при нерегулярных возмущениях // В межвуз. сб. «Модели неоднородных сред» под ред. Филиппова Б.В., Изд-во С.-Пб. ун-та, 2004. C. 227-277.
Granichin O.N., Sysoev S.S. About some characteristics of computers of new generation // In: Proc. of the Int.Conference "Phisycs and Control.", St. Petersburg, Russia, 2003. vol.3, pp.804-807.
Граничин О.H., Красоперова М.А. Применение алгоритма стохастической аппроксимации с одновременным возмущением на входе в реконструктивном моделировании стихосложения // В сб.: "Формальные методы лингвистической поэтики", Изд-во С.-Пб. ун-та, 2001. C. 26-36.
Граничин О.Н., Лившиц А.Н., Соловьев В.Ф. О некоторых принципах создания робота познания // В сб.тр.: "Первой межд. конф. по мехатронике и робототехнике", С.-Петербург, 2000, т. 2. C. 83-86.
Granichin O.N. Unknown Parameters Identification With Excite Test Signals // In: Proc. of the JSST Int. Conf. on Modeling, Control and Computation in Simulation (JSST'2000), Tokyo, Japan, pp. 248-251.
Granichin O.N., Fomin V.N. Adaptive Control with Exciting Signals // In: Proc. of the 4-th Beijing Int. Conf. on System Simulation and Scientific Computing, Beijing, China, 1999, pp. 173-177.
Granichin O.N. Stochastic Approximation under Dependent Noises, Detecting Signals and Adaptive Control // In : Proc. of the 1-st Int. Conf. on "Approximation, Probability and Related Fields", G.Anastassiou and S.T.Rachev eds., 1994, Plenum, pp. 247-271.
4.7.2. Список основных публикаций руководителя проекта в рецензируемых журналах за последние 3 года:
1. Method of measurements with random perturbation: Application in photoemission experiments // Review of Scientific Instruments.- 79, 036103. 2008 (совместно с D. S. Fedin, Yu. S. Dedkov, and S. L. Molodtsov.)
2. Решение задачи автоматического распознавания отдельных слов речи при помощи рандомизированного алгоритма стохастической аппроксимации // Нейрокомпьютеры: разработка, применение, 2008, 7 (совместно с Шалымовым Д.С.)
3.Алгоритмы оптимизации энергопотребления в мобильных устройствах // Нейрокомпьютеры: разработка, применение, 2007, 6 (совместно с Краснощековым В.Е.)
4.Точность оценивания рандомизированного алгоритма стохастической оптимизации // Автоматика и телемеханика.- 2006, 4 (совместно с Вахитовым А.Т. и Сысоевым С.С.)
5.Новая модель процесса вычислений: обобщение концепции машины Тьюринга // Нейрокомпьютеры: разработка, применение.- 2006, 7 (совместно с Жувикиной И.А.)
4.8. Перечень оборудования и материалов, имеющихся у коллектива для выполнения проекта:
8 компьютеров
хранилище данных
1 сканер
1 принтер
1 видеокамера
1 цифровой фотоаппарат
4.9. Перечень оборудования и материалов, которые необходимо дополнительно приобрести, изготовить или отремонтировать для успешного выполнения проекта:
Для проведения исследований по проекту в дополнение к имеющемуся необходимо следующее оборудование:
1) 1 сервер для Интернет-приложений - 60000 руб.
2) 1 мультимедиа-компьютер для работы с изображениями и звуком - 40000 руб.
3) 1 переносной компьютер для организации мобильной работы и демонстрации результатов во время семинаров и конференций - 40000 руб.
4) комплектующие для имеющихся компьютеров - 30000 руб. (общая сумма)
5) картриджи, канцелярские принадлежности и другие расходные материалы - 25000 руб. (общая сумма)
4.10.1. Сроки проведения в г. экспедиции по тематике проекта, если это необходимо:
4.10.2. Ориентировочная стоимость экспедиции (в руб.):
4.10.3. Регион проведения экспедиции:
4.10.4. Название района проведения экспедиции:
Подпись руководителя проекта:

Unless otherwise stated, the content of this page is licensed under Creative Commons Attribution-ShareAlike 3.0 License