Разное

Свд медицина расшифровка: Синдром вегетативной дистонии — лечение, симптомы, причины заболевания, диагностика и профилактика

Содержание

Список медицинских сокращений — это… Что такое Список медицинских сокращений?

Список медицинских сокращений

Эта страница — глоссарий.

А

Б

В

Г

Значок «Готов к санитарной обороне СССР»

Д

  • ДАД — Диастолическое артериальное давление
  • ДАНС — Диабетическая автономная кардионейропатия сердца
  • ДБСТ — Диффузные болезни соединительной ткани
  • ДВНС — Дисфункция височно-нижнечелюстного сустава — (Temporomandibular joint disorder)
  • ДВС — Диссеминированное внутрисосудистое свёртывание
  • ДВС-синдром — Синдром диссеминированного внутрисосудистого свертывания
  • ДГ — Диффузный гломерулонефрит
  • ДГИ — Диссеминированная гонококковая инфекция
  • ДГС — Дыхательные газовые смеси
  • ДГР — Дуоденогастральный рефлюкс
  • ДГЭР — Дуоденогастральноэзофагеальный рефлюкс
  • ДД — Дифференциальный диагноз
  • ДДЗП — Дегенеративно-дистрофические заболевания позвоночника
  • ДДП — Давление в дыхательных путях, Дыхательные движения плода, Добавочная доля печени, Дегенеративно-дистрофическое поражение
  • ДЕ — Двигательная единица
  • ДЕС — Диэтилстильбэстрол (Синэстрол)
  • ДЖВП — Дискинезия желчевыводящих путей
  • ДЖЕЛ — Должная жизненная емкость легких — Спирометрия
  • ДЗЛА — Давление заклинивания в легочной артерии
  • ДЗН — Диск зрительного нерва
  • ДКБ — Декомпрессионная болезнь
  • ДКМП — Дилатационная кардиомиопатия
  • ДКТ — Длительная кислородотерапия
  • ДЛзд — Диффузионная способность лёгких при задержке дыхания
  • ДЛус — Диффузионная способность лёгких в устойчивом состоянии
  • ДМВЛ — Должная максимальная вентиляция легких — Спирометрия
  • ДМЖП — Дефект межжелудочковой перегородки
  • ДМК — Дисфункциональные маточные кровотечения
  • ДМН — Доктор медицинских наук
  • ДМПП — Дефект межпредсердной перегородки
  • ДН — Дыхательная недостаточность
  • ДНК — Дезоксирибонуклеиновая кислота
  • ДО — Дыхательный объём
  • ДОПЖ — двойное отхождение магистральных сосудов от правого желудочка
  • дПНА — Дистальный сегмент передней нисходящей артерии
  • ДППГ — Доброкачественное пароксизмальное позиционное головокружение
  • ДС — Дыхательная система
  • ДТЛ — Деменция с тельцами Леви
  • ДХЛЖ — Дополнительная хорда левого желудочка
  • ДЭНД — Доброкачественные эпилептиформные нарушения детства
  • ДЭхоКГ — Допплерэхокардиография
  • ДЭ — Дисциркуляторная энцефалопатия

Е

  • E2 — Эстрадиол
  • ЕД — единицы

Ж

З

  • ЗББА — Задняя большеберцовая артерия
  • ЗВП — Зрительные вызванные потенциалы
  • ЗВПВ — Зрительные вызванные потенциалы на вспышку света
  • ЗВИШП — Зрительные вызванные потенциалы на обращение шахматного паттерна
  • ЗГТ — Заместительная гормональная терапия
  • ЗИФТ (ZIFT) — Перенос зигот в маточные трубы
  • ЗИЭ — Затяжной инфекционный эндокардит
  • ЗМА — Задняя мозговая артерия
  • ЗМЖВ — Задняя межжелудочковая ветвь
  • ЗМС — Закрытый массаж сердца
  • ЗПА — Заболевание периферических артерий
  • ЗППП, БППП или ИППП — Заболевания, передающиеся половым путём
  • ЗСЛЖд — Задняя стенка левого желудочка
  • ЗСН — Застойная сердечная недостаточность
  • ЗЧМТ — Закрытая черепно мозговая травма

И

К

  • КА — Коарктация аорты
  • КАКГ — Киноангиокардиография
  • кап/мин — капель в минуту
  • КБД — Кортико-базальная дегенерация
  • КВДП — Катар верхних дыхательных путей — Острая респираторная вирусная инфекция
  • КГ — Криоглобулин
  • КГМ — Криоглобулинемия
  • КГСП — Кальцитонингенсвязанный пептид
  • КДД — Конечное диастолическое давление
  • КДДЛЖ — Конечное диастолическое давление в левом желудочке
  • КДО — Конечный диастолический объём
  • КДР — Конечный диастолический размер
  • КДРЛЖ — Конечно-диастолический размер левого желудочка
  • КИНК — Критическая ишемия нижних конечностей
  • КИО2 — Коэффициент использования кислорода
  • КК — Клиренс креатинина
  • КК — Креатинкиназа
  • ккал — килокалория
  • КМН — Кандидат медицинских наук
  • КМП — Кардиомиопатия
  • КОК — Комбинированные оральные контрацептивы
  • КОС — Кислотно-основное состояние
  • КПМД — Конечностно-поясная мышечная дистрофия
  • КПП — Коленно-пяточная проба
  • КПТаза — Карнитиниальмитилтрансфераза
  • КПУ — Количество кариозных зубов (К), пломбированных (П) и удаленных (У) (индекс) — DMF
  • КРБС — Комплексный регионарный болевой синдром
  • КСО — Конечный систолический объём
  • КСР — Комплекс серологических реакций
  • КСР — Конечный систолический размер
  • КТ — Компьютерная томография
  • к-та — Кислота
  • КФК — Креатинфосфокиназа
  • КФК — Креатинкиназа
  • КЩР — Кислотно-щелочное равновесие
  • КЭ — каротидная эндартерэктомия

Л

М

  • М — Мигрень
  • МА — Мерцательная аритмия
  • МА — Мультисистемная атрофия
  • МАГ — Магистральные артерии головы
  • МАО — Моноаминооксидаза
  • MAC — Синдром Морганьи-Адамса-Стокса
  • МБА — малоберцовая артерия
  • МБК — Минимальная бактерицидная концентрация
  • МБК — Множественный быстротекущий кариес
  • МБТ — Микробактерия туберкулёза — Туберкулёз
  • МВ — Маргинальная ветвь
  • МВ — Микробная вегетация
  • МВЛ — Максимальная вентиляция легких — Спирометрия
  • мг/кг — миллиграмм на килограмм массы тела
  • мг/кг/мин — миллиграмм на килограмм массы тела в минуту
  • мг/кг/сут — миллиграмм на килограмм массы тела в сутки
  • мг/м2 — миллиграмм на квадратный метр поверхности тела
  • мг/сут — миллиграмм в сутки
  • МЕ — Mеждународные единицы
  • МЕЗА (MESA) — Аспирация сперматозоидов из придатка яичка
  • мес — месяц
  • МЖП — Межжелудочковая перегородка
  • МЖПд — Межжелудочковая перегородка в диастолу (толщина)
  • МЖПс — Межжелудочковая перегородка в систолу (толщина)
  • МИБП — Медицинские иммунобиологические препараты
  • мин — минута
  • МИЦ — Медико-инженерный центр
  • МК — Митральный клапан
  • МКБ — Мочекаменная болезнь
  • МКБ — Международная классификация болезней
  • МКБ-10 — Список классов МКБ-10 — Международная классификация болезней 10-го пересмотра
  • мкг — микрограмм
  • МКК — Малый круг кровообращения
  • мкл — микролитр
  • мкмоль — микромоль
  • М-КСФ — Макрофагальный колониестимулирующий фактор
  • мл — миллилитр
  • МЛА — Метод лактационной аменореи — Контрацепция
  • ММК — Мигрирующий моторный комплекс
  • ММЛЖ — Масса миокарда левого желудочка
  • ммоль — миллимоль
  • мм рт. ст. — миллиметр ртутного столба
  • МН — Митральная недостаточность
  • МНН — Международное непатентованное название
  • МО — Минутный объём (сердца)
  • МО — Митральное отверстие
  • МОБКК — Минутный объём большого круга кровообращения
  • МОД — Минутный объём дыхания
  • МОК — Минутный объем кровообращения
  • МОС — Минутный объём сердца
  • МОС — Мгновенные объемные скорости — Спирометрия
  • МПД — Мозговое перфузионное давление
  • МПК — Минимальная подавляющая концентрация
  • МПП — Межпредсердная перегородка
  • МПО2 — Минутное поглощение кислорода
  • MP — Магнитный резонанс
  • мРНК — Матричная рибонуклеиновая кислота
  • МРТ — Магнитно-резонансная томография
  • МС — Метаболический синдром
  • МС — Митральный стеноз
  • МС — Мочевыделительная система — Выделительная система
  • МСА — Мультисистемная атрофия
  • МСГ — Меланоцитостимулирующий гормон
  • МСКТ — Мультиспиральная компьютерная томография
  • МЦД — Минимальная церебральная дисфункция
  • МЭС — Приступ Морганьи-Эдемс-Стокса

Н

О

  • ОАА — Отягощенный акушерский анамнез
  • ОАА — Общество Анонимных Алкоголиков
  • ОАМ — общий анализ мочи
  • ОАП — Открытый артериальный проток
  • ОБМ — Основной белок миелина
  • ОБР — Отпускаемые без рецепта
  • ОГ — Ортостатическая гипотония
  • ОГН — Острый гломерулонефрит
  • ОГП — Органы грудной полости
  • ОД — Правый глаз (от OD — oculus dexter)
  • ОДС — Опорно-двигательная система
  • ОЕЛ — Общая емкость легких
  • ОЖСС — Общая железосвязывающая способность сыворотки крови
  • ОЗМ — Острая задержка мочи
  • ОИВ — Оплодотворение ин витро
  • ОИ — Оба глаза (от OU — oculi utriusgue)
  • ОИЭ — Острый инфекционный эндокардит
  • ОИМ — Острый инфаркт миокарда
  • ОК — Оральные контрацептивы — Комбинированные оральные контрацептивы
  • ОКН — Острая кишечная непроходимость
  • окЛПНП — окисленные Липопротеины низкой плотности
  • ОЛЛ — Острый лимфоцитарный лейкоз
  • ОЛС — Общее лёгочное сопротивление
  • ОМЛ — Острый миелоидный лейкоз
  • ОМС — Обязательное медицинское страхование
  • ОНМК — Острое нарушение мозгового кровообращения — Инсульт
  • ООиСБАХП — Остальные органы и системы без актуальной хирургической патологии
  • ООЛ — Остаточный объём легких — Спирометрия
  • ООО — Открытое овальное окно
  • ОПБ — Областная психиатрическая больница
  • ОПГ — Общая плетизмография
  • ОПН — Острая почечная недостаточность
  • ОПС — Общее периферическое сопротивление
  • ОПСС — Общее периферическое сосудистое сопротивление — Артериола
  • ОПТ — Общая патогенная терапия
  • ОИП — Острая интермиттирующая порфирия
  • ОРВИ — Острая респираторная вирусная инфекция
  • ОРИТ — Отделение реанимации и интенсивной терапии
  • ОРЗ — Острое респираторное заболевание — Острая респираторная вирусная инфекция
  • ОРИ — Острые респираторные инфекции
  • ОРЛ — Острая ревматическая лихорадка
  • ОРЭМ — Острый рассеянный энцефаломиелит
  • ОС — Левый глаз (от OS — oculus sinister)
  • ОСА — Общая сонная артерия
  • ОСМП — Отделение скорой медицинской помощи
  • ОТ — Оптическая томография
  • ОТТГ — Оральный тест на толерантность к глюкозе
  • ОФВ — Объём форсированного выдоха — Спирометрия
  • ОФВ1 — Объём форсированного выдоха за 1 с.
  • ОФЭКТ — Однофотонная эмиссионная компьютерная томография
  • ОХс — Общий холестерин
  • ОЦК — Объём циркулирующей крови
  • ОЦП — Одышечно-цианотический приступ
  • ОЧМТ — Открытая черепно мозговая травма

П

  • ПА — Подключичная артерия
  • ПА — Предастма
  • ПАБК — Пара-аминобензойная кислота
  • ПАСК — Парааминосалициловая кислота
  • ПБ — Предбронхит
  • ПББА — Передняя большеберцовая артерия
  • ПБГ — Порфобилиноген
  • ПВ — Протромбиновое время
  • ПВ — Психотропные вещества
  • ПВН — Периферическая вегетативная недостаточность
  • ПГ — Простагландины
  • ПГ — Пучок Гиса
  • ПДДЕ — Потенциал действия двигательных единиц
  • ПДКВ — Положительное давление в конце выдоха
  • ПЕЗА (PEZA) — Перкутанная аспирация сперматозоидов
  • ПеМП — Переменное магнитное поле
  • ПЖ — Правый желудочек
  • ПЗ — Практически здоровые
  • ПЗД (PZD) — Рассечение зоны пеллюцида
  • ПИ — Предсердный индекс
  • ПИР — Постизометрическая релаксация мышц
  • ПИР — Период изометрического расслабления
  • ПИСБП — печень и селезёнка без патологии
  • ПИТ — Палата интенсивной терапии
  • ПИФ — Прямая иммунофлюоресценция
  • ПИЭ — Подострый инфекционный эндокардит
  • п/к — подкожно
  • ПКА — Правая коронарная артерия
  • ПКЦВ — Пункция и катетеризазия центральной вены
  • ПЛР — Побочная лекарственная реакция
  • ПЛР — Постлучевая реакция
  • ПКЯ — Поликистозные яичники — Синдром поликистозных яичников
  • ПЛСГ — Пятнистая лихорадка Скалистых гор
  • ПМА — Передняя мозговая артерия, Пароксизм мерцательной аритмии
  • ПМЖВ — Передняя межжелудочковая ветвь
  • ПМК — Пролапс митрального клапана
  • ПМЛ — Прогрессирующая мультифокальная лейкоэниефалопатия
  • ПМОН — Подострая миело-оптическая невропатия
  • ПМП — Постоянное магнитное поле
  • ПМП — Первая медицинская помощь
  • ПМР — Пузырно-мочеточниковый рефлюкс
  • ПМС — Предменструальный синдром
  • ПН — Почечная недостаточность
  • ПНА — Передняя нисходящая артерия
  • ПНМК — Преходящие нарушения мозгового кровообращения
  • ПНП — Пальце-носовая проба
  • ПНП — Прогрессирующий надъядерный паралич (болезнь Стила — Ричардсона — Ольшевского)
  • ПНС — Периферическая нервная система
  • ПНЖК — Полиненасыщенные жирные кислоты
  • ПОВ — Позитивные острые волны
  • ПОЛ — Перекисное окисление липидов
  • ПОП — Поясничный отдел позвоночника
  • ПОС — Пиковая объемная скорость — Спирометрия
  • ПОХ — Поясничный остеохондроз
  • ПП — Правое предсердие
  • ПРЛ — Пролактин
  • ПРТ — Пероральная регидратационная терапия
  • ПС — Пищеварительная система
  • ПСА — Правая сонная артерия
  • ПСВ — Правы синус Вальсальвы
  • ПСВДП — Повышенное сопротивление верхних дыхательных путей
  • ПСПЖ — Передняя стенка правого желудочка
  • ПСПК — Передвижная станция переливания крови
  • ПСС — Периферическое сосудистое сопротивление
  • ПТИ — Протромбиновый индекс
  • ПТГ — Паратиреоидный гормон, Паратгормон
  • ПТМС — Полная транспозиция магистральных сосудов
  • ПФ — Плазмаферез
  • ПФ — Потенциал фибрилляций
  • ПЦР — Полимеразная цепная реакция
  • ПЧЗТ — Повышенная чувствительность замедленного типа (См. Гиперчувствительность.)
  • ПЧНТ — Повышенная чувствительность немедленного типа (См. Гиперчувствительность.)
  • ПЭТ — Позитронно-эмиссионная томография

Р

С

Т

  • Т 1/2 — Время полувыведения антибиотика из крови
  • Т3 — Трийодтиронин
  • Т4 — Тироксин
  • таб — таблетка
  • ТАДЛВ — Тотальный аномальный дренаж легочных вен (в правое предсердие)
  • ТБС — Тазобедренный сустав
  • ТГ — Триглицериды
  • ТЕЗА (TESA) — Аспирация сперматозоидов из яичка
  • Тест — Тестостерон
  • ТИА — Транзиторная ишемическая атака
  • ТК — Трёхстворчатый (трикуспидальный) клапан
  • ТКДГ — Транскраниальная допплерография
  • ТЛБАП — Транслюминальная баллонная ангиопластика
  • ТЛМ — Терапевтический лекарственный мониторинг
  • ТЛТ — Тромболитическая терапия
  • ТН — Трикуспидальная недостаточность
  • ТНЭ — Тромботический неинфекционный эндокардит
  • ТПС — Тибиоперонеальный ствол
  • тРНК — РНК, функцией которой является транспортировка аминокислот к месту синтеза белка
  • ТРФ — Трансформирующий ростовой фактор
  • ТТГ — Тиреотропный гормон, Тупая травма груди
  • ТТП — Тупой твердый предмет (Судебная медицина)
  • ТТЖ — Тупая травма живота
  • ТТЭхоКГ — Трансторакальная эхокардиография
  • ТУР — Трансуретральная резекция
  • ТХП — Тахикардия в покое
  • ТЭО — Тромбоэмболические осложнения (тромбоэмболия)
  • ТЭЛА — Тромбоэмболия лёгочной артерии

У

Ф

  • ФВ — Фракция выброса
  • ФВД — Функции внешнего дыхания
  • ФВД — Исследование функции внешнего дыхания
  • ФГ — Флюорография
  • ФЖ — Фибрилляция желудочков
  • ФЖЕЛ — Форсированная жизненная емкость легких — Спирометрия
  • ФК — Функциональный класс
  • ФМ — Фибромиалгия
  • ФНО — Фактор некроза опухоли
  • ФОЕ — Функциональная остаточная емкость
  • ФОС — Фосфорорганические соединения
  • ФП — Фибрилляция предсердий
  • ФР — Факторы риска
  • ФСГ — Фолликулостимулирующий гормон
  • ФТДП — Фронтотемпоральная дегенерация с паркинсонизмом
  • ФЭГДС — Фиброэзофагогастродуоденоскопия

Х

Ц

  • цАМФ — Циклический аденозинмонофосфат
  • ЦВБ — Церебро-васкулярная болезнь
  • ЦВД — Центральное венозное давление
  • ЦВМГ — Центральное время моторного проведения
  • цГМФ — Циклический гуанозинмонофосфат
  • ЦД — Цветная допплерография
  • ЦИК — Циркулирующие иммунные комплексы
  • ЦМВ — Цитомегаловирус
  • ЦМВИ — Цитомегаловирусная инфекция
  • ЦНС — Центральная нервная система
  • ЦОГ — Циклооксигеназа
  • ЦПК — Цветной показатель крови
  • ЦС — Цефалоспорины
  • ЦСЖ — Цереброспинальная жидкость

Ч

  • ЧАДЛВ — Частичный аномальный дренаж легочных вен (в правое предсердие)
  • ЧД — Частота дыхания
  • ЧДД — Частота дыхательных движений
  • ЧЛХ — Челюстно-лицевая хирургия
  • ЧЛС — Чашечно-лоханочная система
  • чМГ — Человеческий менопаузальный гонадотропин — Гонадотропные гормоны
  • ЧМН — Черепно-мозговые нервы
  • ЧМТ — Черепно-мозговая травма
  • ЧПЭС — Чреспищеводная электрокардиостимуляция
  • ЧПЭхоКГ — Чреспищеводная эхокардиография
  • ЧСЖ — Частота сокращений желудочков
  • ЧСС — Частота сердечных сокращений; Частота сокращений сердца
  • ЧТВ — Частное тромбопластиновое время
  • ЧТКА — Чрескожная транслюминальная коронарная ангиопластика
  • ЧХГ, (чХГ) — Человеческий хорионический гонадотропин — Хорионический гонадотропин

Ш

Щ

Э

Ю

  • ЮА — Ювенильный артрит
  • ЮАС — Ювенильный анкилозирующий спондилит
  • ЮИА — Ювенильный идиопатический артрит
  • ЮРА — Ювенильный ревматоидный артрит

Я

Латиница: A

  • a.a. (ana partes aequales) — равные количества, поровну
  • a.c. (ante coenam) — перед едой
  • ad — до (до 100 мл, до 100 г)
  • a.u.e. / u.e. (ad usum externum) — для наружного применения
  • a.n. (ante noctem) — перед сном (до ночи)

Латиница: B

  • b.d.d. (bis de die) — дважды в день

Латиница: C

Латиница: D

  • da (da) — выдай
  • d.c. (durante coenam) — во время еды
  • d.c. prohib. (da cum prohibitione) — обращаться с осторожностью (?)
  • d.d. (de die) — в течение дня
  • d.i.m.m. (da in manum medici) — выдать на руки врачу (обычно используется при назначении наркотических средств)
  • d.s. monit. (da sine monitione) —
  • d.s.p. (da sine prescriptione) — выдать без рецепта
  • d.t.d. (da tales doses) — выдай таких доз

Латиница: F

Латиница: H

Латиница: L

Латиница: M

  • m. (mane) — ручной (для рук)
  • m.f. (misce fiat) — смешай чтобы получилось

Латиница: O

  • o.d. / o.s. (oculus dexter/sinister) — правый/левый глаз
  • OTC (Over-the-Counter) — безрецептурные препараты

Латиница: P

  • Pg — простагландины
  • p.c. (post coenam) — после еды
  • p.o. — (per os) — через рот (приём лекарственных средств)
  • p.r. — (per rektum) — через прямую кишку (введение лекарственных средств)

Латиница: Q

  • q.s. (quantum satis) — сколько требуется, необходимое количество

Латиница: R

  • Rp. (recipe) — возьми

Латиница: S

  • S. (signa) — обозначь (укажи способ применения лекарства)
  • sol. (solutio) — раствор
  • subling. (sublinguata) — под язык
  • si nec. sit (si necesse sit) — если так необходимо
  • supp. (suppositorium) — суппозиторий

Латиница: T

Латиница: V

  • vesp. (vespere) — вечером

Ссылки

Категории:
  • Глоссарии
  • Списки:Медицина
  • Списки сокращений

Wikimedia Foundation. 2010.

  • Гамен, Алексей Юрьевич
  • Малые Туваны

Полезное


Смотреть что такое «Список медицинских сокращений» в других словарях:

  • СПИСОК ОСНОВНЫХ СОКРАЩЕНИЙ И АББРЕВИАТУР — абс. абсолютный авт. автономный автомоб. автомобильный агр. аграрный акад. академик алгебр. алгебраический альп. альпийский алюм. алюминиевый АН Академия наук анат. анатомический анс. ансамбль арт. артиллерийский, артист арх. архипелаг археол.… …   Естествознание. Энциклопедический словарь

  • Список латинских писателей раннего средневековья —     …   Википедия

  • Список аббревиатур —   Это служебный список статей, созданный для координации работ по развитию темы.   Данное предупреждение не устанавливается на информационные списки и глоссарии …   Википедия

  • Список сокращений русского языка — …   Википедия

  • Список латинских писателей раннего Средневековья — …   Википедия

  • П:МЕД — Начинающим · Сообщество · Порталы · Награды · Проекты · Запросы · Оценивание География · История · Общество · Персоналии · Религия · Спорт · Техника · Наука · Искусство · Философия …   Википедия

  • НЗЛ — Сокращение НЗЛ может означать: Неспецифические заболевания лёгких (см. Список медицинских сокращений) Новая Зеландия Новое в зарубежной лингвистике …   Википедия

  • МЕДИЦИНСКАЯ ЛИТЕРАТУРА — МЕДИЦИНСКАЯ ЛИТЕРАТУРА. Содержание: I. Медицинская литература научная……. 54 7 II. Список мед. журналов (1792 1938)…… 562 III. Медицинская литература популярная….. 576 (цветники), лечебники (целебники, врачебники), фармакопеи (аптеки).… …   Большая медицинская энциклопедия

  • Аббревиатура — У этого термина существуют и другие значения, см. Аббревиатура (значения). Аббревиатура (итал. abbreviatura от лат. brevis  краткий) или сокращение. В старинных рукописях и книгах сокращённое написание слова или группы слов,… …   Википедия

  • Севастополь — У этого термина существуют и другие значения, см. Севастополь (значения). Город Севастополь укр. Севастополь Флаг Герб …   Википедия


УЗИ при беременности

Однако есть и другие причины, просто обязывающие и врачей, и пациенток к проведению УЗИ при задержке менструации и первых признаках беременности раннего срока (БРС). Основные из них таковы: 
  • необходимо исключить внематочную беременность и убедиться, что она — маточная;
  • необходимо исключить пузырный занос, по всем клиническим и лабораторным признакам похожий на беременность, однако являющийся опасным заболеванием;
  • при наличии маточной беременности необходимо определить качество гестационного процесса, в случае выявления патологии беременности необходимо своевременно выяснить причины патологии и своевременно начать лечение;
  • УЗИ с достоверностью определяет срок беременности: эта информация определяет и срок родов;
  • в том случае, если задержка менструации происходит, но беременность не выявлена, УЗИ поможет определить гинекологическое заболевание, явившееся причиной задержки месячных.

Таким образом, УЗИ при беременности на раннем сроке совершенно необходимо, однако до сих пор бытуют представления о вреде УЗИ. Тем не менее, безопасность медицинского ультразвука доказана и отражена в международных документах. Рекомендации к сокращению продолжительности каждого исследования БРС, носят этический характер, учитывающий опасения будущих мам в отношении УЗИ. 
Итак, каковы же возможности ультразвука? При задержке месячных всего на 3-5 дней ультразвуковой сканер с трансвагинальным датчиком может зарегистрировать маточную беременность сроком 2,5-3 недели от момента зачатия. УЗИ при беременности на раннем сроке позволяет определить эмбриологический срок беременности, т.е. срок, исчисляемый от момента слияния половых клеток.

Принятый в акушерстве отсчет от первого дня последней менструации может быть неточным, по нему сложно определить предполагаемый момент родов. Чтобы перевести эмбриологический срок беременности в акушерский, необходимо к эмбриологическому сроку прибавить 2-2,5 недели. В сроке 2,5-3 недель завершается процесс имплантации бластоцисты в слизистую оболочку матки.

С этого момента она называется плодным яйцом и становится доступной для исследования. В этом сроке бластоциста или эмбриональная камера выглядит как темное округлое или каплевидное образование, 4-5 мм в диаметре. Эмбриональная камера окружена оболочкой и не отражает ультразвуковых волн, т.е. она эхонегативна. Эмбрион и внезародышевые органы имеют микроскопическое строение и пристеночную локализацию, поэтому пока не видны при помощи ультразвука: в этом сроке плодное яйцо выглядит как однородная жидкость. Место имплантации плодного яйца чаще всего находится в области одного из трубных углов, но иногда локализация плодного яйца расположена низко, ближе к перешейку. Такая проксимальная локализация происходит в том случае, если бластоциста перемещается в полости матки в течение нескольких дней после выхода из маточной трубы и лишь потом имплантируется в стенку матки.

Если при задержке менструации в матке с помощью УЗИ не обнаруживается плодное яйцо, необходимо пройти обследование через одну-две недели, чтобы плодное яйцо увеличилось в размерах. Отсутствие плодного яйца при повторном обследовании должно насторожить врача: в таком случае возможна внематочная беременность. Однако диагноз внематочной беременности невозможно установить только лишь с помощью УЗИ, необходимо более тщательное обследование.

В некоторых случаях, когда в полости матки обнаруживается округлое жидкостное образование, но лабораторные и клинические данные не подтверждают наличие беременности, повторное обследование поможет диагностировать наличие железистого полипа, кисты или миоматозного узелка, выдающегося в полость матки. Округлое жидкостное образование может оказаться небольшим. Подобные проблемы необходимо решать только в специализированном учреждении, имеющим лицензию на работу с беременными. Там же необходимо проходить и УЗИ БРС (и любого другого срока беременности).

В женской консультации, родильном доме, перинатальном центре только профессионал – врач-эхоскопист – компетентен в области физиологии и патологии женской половой сферы, акушерства и прикладной эмбриологии. В настоящее время очень распространены центры, оказывающие услуги по принципу «УЗИ всего на свете» – эти центры не обеспечивают профессиональное обследование на должном уровне и допускают большое количество ошибок при постановке диагноза.

Итак, беременность обнаружена, плодное яйцо имплантировалось в стенку матки и очень быстро увеличивается в размерах. 17-20 мм – такой диаметр плодного яйца в четыре недели беременности. Плодное яйцо становится овальным, размеры матки немного увеличиваются, и появляется асимметрия ее стенок — одна стенка становится толще другой. Эмбрион станет виден только в 5 недель беременности, а пока хорошо различается желточный мешок, в котором хранится запас питательных веществ для развивающегося эмбриона. Продолговатый 5-недельный эмбрион имеет в длину несколько мм, к внутренней поверхности плодного яйца от эмбриона тянется амниотическая ножка – будущая пуповина. С этого момента эмбрион может свободно передвигаться в жидкости эмбриональной камеры – он покидает свое пристеночное положение.

При 5-недельной беременности уже можно определить, один эмбрион или два поселились в эмбриональной камере. Количество и строение амниотических оболочек и хориона — будущей плаценты – определяют вид будущей двойни. Если зародышевый материал в бластоцисте удвоен – развивается однояйцевая (монохориальная) двойня с полностью идентичным набором хромосом. Дети из такой двойни всегда однополые и абсолютно похожи друг на друга.

Но если перед зачатием в разных яичниках овулируют два фолликула, то сливаются две пары половых клеток и образуются две бластоцисты, которые имплантируются и формируется два плодных яйца с двумя эмбрионами. В таком случае образуется разнояйцевая двойня – бихориальная или дихориальная. Такие дети не являются близнецами в строгом смысле слова, потому что у них разные наборы хромосом, они могут быть разного пола и ничуть не похожими друг на друга. 70% родившихся двоен являются разнояйцевыми. Но, кроме двоен, существуют еще тройни, и вообще многоплодная беременность. Возможны различные варианты сочетаний амниотических оболочек и хорионов: так, тройня может состоять их двух близнецов и одного разнояйцевого с ними ребенка. УЗИ БРС легко идентифицирует тип двойни или тройни, но на поздних сроках это сделать труднее, т.к. эмбриональные камеры заполнят всю полость матки. Но кроме двоен и троен такого типа (каждый эмбрион находится в отдельной эмбриональной камере), существует патологический вариант многоплодной беременности (монамниотическая монохориальная беременность), когда эмбрионы не разделены межамниотической перегородкой. В этом случае возможен вариант появления сросшихся (сиамских) близнецов и развития генетически неполноценного плода. Такую беременность необходимо прервать на самом раннем сроке и предотвратить развитие подобной катастрофы. Именно УЗИ БРС позволяет предвидеть и предотвращать трагическое развитие беременности.
Поскольку развитие би-двойни происходит вследствие овуляции двух фолликулов, в яичниках находится два желтых тела (ЖТ).

Что же такое желтое тело?

ЖТ возникает в яичнике на месте овулировавшего фолликула: ЖТ — это временный гормональный орган. ЖТ отвечает за продукцию прогестерона – основного гормона беременности, при УЗИ ЖТ выглядит как округлое образование из неоднородных мягких тканей. По изображению, полученному при УЗИ, невозможно определить прогестероновую недостаточность, однако клинические, лабораторные исследования вполне дают возможность диагностировать эту недостаточность.

При развитии беременности в ЖТ иногда могут образовываться кисты. Причина образования кист заключается в том, что желтое тело вырабатывает небольшие количества жидкости. Часть этой жидкости резорбируется кровеносными сосудами яичника, а часть — остается внутри яичника, образуя пузырьки, которые и формируют кисты (от греческого корня «cyst» — «пузырек»). К 10-15 неделе беременности киста ЖТ полностью рассасывается, поскольку уменьшается и само ЖТ. Кисты ЖТ не представляют угрозы для беременности, но иногда женщина может ощущать боли внизу живота, принимая их за симптом угрожающего выкидыша.

Может ли УЗИ определить признаки угрожающего выкидыша?

При выкидыше происходит отслоение плодного яйца от внутренней стенки матки и в результате сокращения миометрия изгнание его из полости матки. Этот процесс делится на фазы: угрожающий выкидыш, начавшийся, «в ходу» и свершившийся. Избыточное напряжение (гипертонус) мышц матки определяются УЗИ.

Каковы УЗ-признаки начинающегося выкидыша?

  • УЗ-признак, показывающий утолщение одной из стенок матки, может быть обманчив, так как существует физиологическая асимметрия стенок матки, обнаруживаемая еще при УЗИ БРС. Кратковременное сокращение матки может возникнуть из-за давления вагинального датчика на область перешейка матки. Такое кратковременное сокращение может быть принято за признак угрожающего выкидыша. Длительный гипертонус от кратковременного различается с помощью трансабдоминального датчика с пустым мочевым пузырем. Застойный гипертонус, свидетельствующий об угрозе выкидыша, существует долго, а кратковременный скоро исчезает.
  • Изменение конфигурации плодного яйца, превращение ее формы в ладьевидную или каплеобразную, изменение наружного контура матки (над ровным контуром матки приподнят бугорок над сократившимся участком миометрия).
  • Самый грозный признак угрожающего и начавшегося выкидыша – кровянистые выделения, образующиеся из-за того, что в полость матки изливается некоторое количество крови рядом с плодным яйцом — субхориальная гематома (гравидарная гематометра). Плодное яйцо при инвазии в стенку матки разрушает мелкие сосуды, при этом увеличивающаяся гематома оказывает давление на плодное яйцо, в результате чего теряется связь меж ним и стенкой матки. УЗИ определяет объем и локализацию гравидарной гематометры, время ее образования и тенденцию к прогрессированию. Таким образом, причина болей и кровянистых выделений при угрожающем выкидыше может быть определена ультразвуком, что поможет спланировать стратегию лечения (при гипертонусе матки с гематомой и без нее она будет разной и даже взаимоисключающей). Но при отсутствии болей внизу живота, кровянистых выделений и других признаков угрожающего выкидыша ультразвуковые данные, свидетельствующие об угрозе, необходимо интерпретировать, как чисто аппаратный феномен. Аналогом выражения «угроза по УЗИ» может быть выражение «головная боль по анализу мочи».

Однако самопроизвольный выкидыш бывает без болей и гипертонуса. Этот случай носит название несостоявшийся выкидыш («анэмбриония», «неразвивающаяся» или «замершая беременность»). При замершей беременности жизнедеятельности эмбриона прекращается, а сократительная деятельность матки, направленная на изгнание нежизнеспособного плодного яйца из ее полости, отсутствует.

Эмбрион и все элементы эмбрионального комплекса при УЗИ на 5 неделе беременности в случае анэмбрионии не визуализируются. Это свидетельствует о том, что развитие зародыша прекратилось до того, как эмбрион достиг размеров в 1-2 мм. Повторное исследование с интервалом в неделю при подозрении на анэмбрионию позволит уточнить диагноз. Когда эмбрион отчетливо виден (например, при короткой амниотической ножке и пристеночном расположении эмбриона), возникает возможность исключить анэибрионию, при которой плодное яйцо растет из-за накапливающейся в нем жидкости, но изображения эмбриона получить по-прежнему не удается.

В случае анэмбрионии одного из плодных яиц при двойне, так называемой биамниотической монэмбриональной беременности, один из эмбрионов не развивается (несостоявшаяся двойня). Рядом с нормальной обнаруживается «пустая» амниотическая полость, затем, по мере роста плодного яйца, она серповидно огибает изображение нормальной амниотической полости и затем сливается с ней полностью. УЗ-феномен, описывающийся как «двойной контур плодного яйца» или «амниотическая нить в полости матки» – это признак несостоявшейся двойни. Этот признак не нарушает течения одноплодной беременности.

Несостоявшийся выкидыш в сроке 5 и более недель носит название замершей беременности. При замершей беременности эмбриональный комплекс виден (в отличие от анэмбрионии). Однако эмбриональный комплекс состоит из слабодифференцируемых линейных объектов, в котором отсутствуют признаки жизнедеятельности — сердцебиение и двигательная активность, характерные для нормального эмбриона при прогрессирующей беременности.

В норме при 5-недельной беременности эмбрион достигает размеров 7-8 мм, при 6-недельной — 12-13 мм и 18-19 мм — при 7 недельной беременности. «Рост» эмбриона называется копчико-теменным размером (КТР). Увеличивается и «окружность талии» эмбриона — от 2-3 мм до 6-8 за две недели. «Пульсация эмбриона» — сердечные сокращения определяются, начиная от 5 недели, но сердце на экране пока различить невозможно. На 5-6 неделе беременности частота сокращений — 120-130 уд/мин, к 7-8 неделе она достигает до 200 уд/мин. В этом сроке при УЗИ уже видны разгибательные движения эмбриона.

Головной конец от тазового можно отличить уже к 5 неделе от зачатия, а к 6 неделе на месте будущих конечностей появляются бугорки. После 8 недели беременности видны внутренние органы плод, позвоночник и кости черепа видны к концу 7 недели. Живой, здоровый и подвижный эмбрион встретится с будущей мамой и врачом в кабинете УЗ-диагностики в сроке 10-14 акушерских недель (то есть 8-12 неделе от зачатия). Рассказ об этой встрече еще впереди. В течение беременности эмбриона ждет много событий и опасностей, которых он успешно избежит с помощью помощи мамы, врача и, конечно, медицинского ультразвука. Вскоре он станет не эмбрионом, а плодом, а несколько позже — и новорожденным!


Наше оборудование

В своей работе мы используем последние достижения мировой практики. Наши врачи проводят УЗИ исследования на аппаратах экспертного уровня, таких как GE LOGIQ E9, GE VIVID 9, GE VOLUSON E8, GE VOLUSON E10.

УЗИ-аппарат VOLUSON E10 оснащен особым электронным датчиком, позволяющим докторам с максимальной точностью проводить диагностику пороков развития плода, оценку риска наследственной патологии, осложнений беременности.
Уже с самых ранних сроков, используя уникальные режимы Radience Flow, можно с максимальной точностью оценить структуры сердца плода, исключить пороки развития, а широчайший спектр возможностей 3D и 4D, в том числе, режим HD life визуализации, дает возможность не только детально оценить анатомию внутренних органов плода, но и с максимальной реалистичностью увидеть своего малыша с самого начала беременности.

Ведение беременности

Когда долгожданная беременность наступает, нужно найти по-настоящему своего врача. Это должен быть человек, которому можно будет доверять, с которым легко получится найти взаимопонимание, который с уважением относится к приватности и конфиденциальности. Именно такие акушеры-гинекологи работают в «Скандинавии», чтобы беременность протекала как можно легче, а рождение малыша осталось радостным воспоминанием. 

С нашими программами ведения беременности вы можете ознакомиться здесь.

Отделение патологии беременности

Несмотря на всю естественность процесса, не всякая беременность проходит гладко, и к этому нужно быть готовыми. Поэтому в «Скандинавии» круглосуточно работает отделение патологии беременности : сюда можно обратиться с возникшими симптомами или осложнениями и рассчитывать на своевременную и качественную помощь.

 

Наши врачи

Цены на услуги:

Услуга доступна

+7 (812) 600-77-77

Санкт-Петербург, 197372, ул. Ильюшина, 4, к. 1

Комендантский проспект

+7 (812) 600-78-25 (взрослое отделение) +7 (812) 600-78-52 (детское отделение)

Санкт-Петербург, 194354, Учебный пер., 2

+7 (812) 600-77-77

Санкт-Петербург, 191014, Литейный пр., 55А

Гостиный двор

Маяковская

+7 (812) 600-77-77

Санкт-Петербург, 196066, Московский пр., 193/2

шагинян.рф — Акушерство и Гинекология

ВЗРОСЛЫЕ (репродуктивный период)

Параметр Нормальное значение

Размеры тела матки:

длина

толщина

ширина

  

42-61 мм

28-42 мм

42-60 мм

Эндометрий:

Сразу после менструации

в 1-ую фазу цикла

на 5-7 день цикла

в периовуляторный период

во 2-ую фазу цикла

перед менструацией

менопауза (стойкая)

менопауза на фоне ЗГТ

 

1-6 мм

до 9 мм

до 7 мм

10-12 мм

12-13 мм

до 15 мм

до 5 мм

до 10 мм

Шейка матки:

длина

цервикальный канал в периовуляторный период

 

до 30-40 мм

до 4-5 мм

Яичники:

длина

толщина

ширина

объём на 5-7 день цикла (неовулирующего)

объём овулирующего

объём в постменопаузе

антральные фолликулы

доминантный фолликул

 

20-39 мм

15-25 мм

20-30 мм

 3-9 см3

до 15 см3

до 4,5 см3 / до 2,2 см3

4-10 шт до 10 мм в d

15-25 мм

 

СВД плодного яйца и срок беременности* (A.Rempen, ± 10 дней)

СВД плодного яйца Срок, нед./дн. СВД плодного яйца Срок, нед./дн.
1 мм 26 мм 7/4
2 мм 4/6 27 мм 7/5
3 мм 5/0 28 мм 7/6
4 мм 5/1 29 мм 8/0
5 мм 5/2 30 мм 8/1
6 мм 5/2 31 мм 8/2
7 мм 5/3 32 мм 8/3
8 мм 5/4 33 мм 8/3
9 мм 5/5 34 мм 8/4
10 мм 5/5 35 мм 8/5
11 мм 5/6 36 мм 8/6
12 мм 6/0 37 мм 9/0
13 мм 6/1 38 мм 9/1
14 мм 6/2 39 мм 9/2
15 мм 6/2 40 мм 9/3
16 мм 6/3 41 мм 9/4 
17 мм 6/4 42 мм 9/5 
18 мм 6/5 43 мм 9/6 
19 мм 6/6 44 мм 9/6 
20 мм 6/6 45 мм 10/0 
21 мм 7/0 52 мм 11/0 
22 мм 7/1 59 мм 12/0 
23 мм 7/2 66 мм 13/0 
24 мм 7/3 72 мм 14/0 
25 мм 7/4 73 мм 14/1 

 

КТР эмбриона/плода и срок беременности* (Hadlock, ± 5 дней)

КТР эмбриона/плода Срок, нед./дн. КТР эмбриона/плода Срок, нед./дн.
2,0 мм 5/5 34,7 мм 10/3
2,4 мм 5/6 36,1 мм 10/4
3,2 мм 6/0 37,5 мм 10/5
4,0 мм 6/1 39,0 мм 10/6
4,9 мм 6/2 40,5 мм 11/0
5,7 мм 6/3 42,1 мм 11/1
6,6 мм 6/4 43,7 мм 11/2
7,5 мм 6/5 45,4 мм 11/3
8,3 мм 6/6 47,1 мм 11/4
9,2 мм 7/0 48,9 мм 11/5
10,1 мм 7/1 50,7 мм 11/6
11,0 мм 7/2 52,6 мм 12/0
11,9 мм 7/3 54,5 мм 12/1
12,8 мм 7/4 56,4 мм 12/2
13,7 мм 7/5 58,4 мм 12/3
14,6 мм 7/6 60,3 мм 12/4
15,6 мм 8/0 62,3 мм 12/5
16,5 мм 8/1 64,3 мм 12/6
17,5 мм 8/2 66,3 мм 13/0
18,5 мм 8/3 68,2 мм 13/1
19,5 мм 8/4 70,1 мм 13/2
20,5 мм 8/5 72,0 мм 13/3
21,5 мм 8/6 73,9 мм 13/4
22,6 мм 9/0 75,7 мм 13/5
23,7 мм 9/1 77,5 мм 13/6
24,8 мм 9/2 79,3 мм 14/0
25,9 мм 9/3 81,0 мм 14/1
27,1 мм 9/4 82,7 мм 14/2
28,2 мм 9/5 84,4 мм 14/3
29,5 мм 9/6 86,0 мм 14/4
30,7 мм 10/0 87,6 мм 14/5
32,0 мм 10/1 89,2 мм 14/6
33,3 мм 10/2 90,7 мм 15/0

 * Указаны акушерские сроки беременности. Срок от зачатия = минус 2 недели.

Первое УЗИ при беременности. Узи в первый триместр когда делать :: АЦМД

Регулярное обследование методом ультразвукового сканирования (чаще именуемого ультразвуковое исследование – УЗИ) является обязательной составляющей дородового наблюдения в соответствии с современными стандартами медицинской помощи в развитых странах.

Десятилетия назад обязательным считалось проведение УЗИ, начиная со 2 триместра беременности. Но, со временем, по мере развития технологий, стало возможным и сочтено целесообразным обследовать будущего ребенка уже в первом триместре. И дело здесь не в каком-то любопытстве врача или родителей, а в возможности оценить раннее развитие плода и проследить далее его рост и взросление. Такая точная информация позволяет (при необходимости) разработать и рекомендовать оптимизированный дородовый уход с наилучшими результатами для матери и плода.

Итак, в начале беременности – в ее первом триместре – методом УЗИ:

  • определяют внутриматочный/внематочный характер беременности
  • подтверждают жизнеспособность плода (по наличию биений сердца)
  • определяют размеры плода (средний внутренний диаметр плодного яйца – СВД и копчико-теменной размер эмбриона/плода – КТР)
  • на их основании с высокой точностью определяют гестационный возраст
  • выявляют грубые нарушения развития плода (синдром Дауна и другие)
  • определяют количество плодов (то есть – является ли беременность многоплодной – двойней, тройней и т.д.)
  • при многоплодной беременности оценивают хориальность (количество плацент) и амниальность (количество отдельных амниотических пузырей)
  • определяют ранние признаки угрозы прерывания беременности (прежде всего – утолщение мышечного слоя матки, что является проявлением ее гипертонуса)
  • диагностируют осложнения беременности со стороны матери (в том числе – кисту желтого тела и пузырный занос)
  • одновременное проведение УЗИ органов малого таза женщины позволяет оценить размеры матки и яичников, а также наличие патологических изменений, включая кисты, доброкачественные и злокачественные новообразования

Проведение ультразвукового исследования в первом триместре беременности позволяет – безопасно и эффективно – подтвердить нормальное течение беременности развитие ребенка или же помочь в диагностике ряда нарушений, как со стороны матери, так и ребенка. В целом ряде случаев, при этом, удается успешно вылечить выявленные осложнения.

Статью подготовили специалисты гинекологического отделения АЦМД-МЕДОКС

Неразвивающаяся беременность на ранних сроках. / Новости / РДЦ

Основными нерешенными на сегодняшний день проблемами в акушерстве и гинекологии, вносящими значительный отрицательный вклад в репродуктивные потери, являются отсутствие уменьшения числа преждевременных родов (прерывания беременности после 22 нед) и уве­личение частоты самопроизвольных выкидышей (до 22 нед).

В настоящее время неразвивающуюся бере­менность принято рассматривать как полиэтиологическое осложнение беременности, в основе которого лежит патологический симптомокомплекс: отсутствие жизнедеятельности эмбриона, дисфункция эндометрия и нарушения в системе гемостаза беременной женщины. Еще в 1995 г. профессор Stuart Campbell заявил, что: «Гибели эмбриона на ранних сроках должно придаваться такое же значение, как и гибели плода на поздних сроках». К сожалению, в настоящее время эта фраза приобрела особое звучание, так как мы жи­вем в эпоху «эпидемии» неразвивающихся беремен­ностей. Их частота среди случаев самопроизвольных выкидышей на ранних сроках возросла за прошед­шие 30 лет с 10—20 % в конце 90-х годов прошлого века до 45-88,6 % в последние годы. Поэтому чрезвычайно актуальными становятся вопро­сы максимально ранней и максимально точной диагностики неразвивающейся беременности.

По клиническим признакам поставить этот диагноз на ранних сроках весьма затруднительно, так как его симптомы не являются специфичны­ми. Так, например, незначительные мажущие кровянистые выделения из половых путей могут появляться через определенный интервал после прекращения ее развития, а могут вообще отсут­ствовать. Далеко не в каждом случае возникают боли внизу живота. Общее недомогание, слабость, головокружение, повышение температуры тела отмечаются только у 10 % женщин при задержке мертвого плода в матке свыше 3—4 нед. Наиболее характерные и давно известные субъективные признаки гибели плодного яйца в I триместре бе­ременности — это исчезновение тошноты, рвоты, слюнотечения. Однако все перечисленное нельзя считать достоверными симптомами замершей беременности. Использование биохимических тестов, таких как сывороточный уровень β-ХГЧ, является вспомогательным методом для прове­дения дифференциальной диагностики в ранние сроки беременности между такими состояниями, как нормальная развивающаяся маточная бере­менность, неразвивающаяся маточная беремен­ность, беременность «неясной локализации» и внематочная беременность. Однако на сегодняш­ний день рекомендуется определять сывороточ­ный уровень β-ХГЧ только в случае «беременности неясной локализации». Не существует показаний для взятия сывороточного β-ХГЧ, если плодное яйцо четко визуализируется в полости матки и нам необходимо подтвердить диагноз беременности, остановившейся в развитии. Именно поэтому приоритет сегодня отдается ультразвуковому ис­следованию, которое позволяет выявить неразвивающуюся беременность задолго до появления клинических симптомов. 

 Диагностические критерии неразвивающейся беременности на ранних сроках:

  1. отсутствие сердечного ритма при копчико – теменном размере эмбриона 7 мм и более;
  2. отсутствие эмбриональной структуры при среднем диаметре (среднее арифметическое 3 диаметров) плодного яйца больше или равно 25 мм.

При  наличии хотя бы одного из указанных признаков диагноз считается окончательным. В этом случае проведение повторных ультразвуковых исследований не требуется. Вероятность того, что в сроке 12 нед. плод окажется жизнеспособным равна нулю.

Есть еще несколько критериев, которые позволяют диагностировать неразвивающуюся беременность:

  • у эмбриона отсутствует сердцебиение через 14 после того, как при ультразвуковом исследовании выявлено плодное яйцо без желточного мешка при первичном приеме;
  • у эмбриона отсутствует сердцебиение через 11 дней после того, как при ультразвуковом ис­следовании выявлено плодное яйцо с желточным мешком при первичном приеме.

Остальные признаки, которые описываются в медицинской литературе, являются прогности­ческими. Они не дают 100 % гарантии, а лишь позволяют заподозрить замершую беременность. При этом требуется проведение дополнительных ультразвуковых исследований для подтверждения или опровержения диагноза «неразвивающаяся беременность».

К прогностическим критериям неразвивающейся беременности относятся:

  • КТР эмбриона < 7 мм, сердцебиение от­сутствует;
  • средний диаметр плодного яйца (среднее арифметическое 3 диаметров) — 16—24 мм, эм­брион отсутствует;
  • отсутствие эмбриона с сердцебиением через 7—10 дней после того, как при ультразвуко­вом исследовании обнаружено плодное яйцо без желточного мешка;
  • отсутствие эмбриона с сердцебиением че­рез 7—10 дней после того, как обнаружено плодное яйцо с желточным мешком;
  • отсутствие эмбриона через 6 нед. после первого дня последней менструации;
  • аномальное строение желточного мешка (неправильная форма, гиперэхогенная структура), размеры более 7 мм или менее 3 мм;
  • маленькое плодное яйцо относительно раз­меров эмбриона (разница в размерах между выше­указанными структурами составляет менее 5 мм), так называемый олигогидрамнион I триместра;
  • аномальные контуры плодного яйца;
  • появление желточного стебля без регистра­ции сердечной деятельности у эмбриона;
  • измененная амниотическая полость;
  • прирост КТР менее 0,2 мм/день;
  • брадикардия эмбриона (частота сердеч­ных сокращений в М-режиме менее 80—90 уд/мин.

При проведении ультразвукового исследо­вания в ранние сроки необходимо соблюдать как четкие методологические подходы, так и прин­ципы безопасности исследования. Необходимо провести оценку следующих структур: плодного яйца, амниотической полости, желточного мешка и эмбриона с регистрируемой в режиме реального времени (В-режиме) или М-режиме сердечной деятельности. До 10 нед. гестации не следует использовать цветовое допплеровское картирование (ЦДК) для регистрации сердеч­ной деятельности, так как при этом тепловой индекс (TI) увеличивается до 2,5—4,2, а согласно принципам ALARA, регламентирующим безопас­ность ультразвукового исследования, проводить сканирование в ранние сроки беременности не рекомендуется при ТI, превышающем пороговое значение 3,0.

Важным вопросом в ультразвуковой диагно­стике неразвивающейся беременности является вопрос повторных ультразвуковых обследова­ний. Необходим выбор оптимального интервала для повторения исследования, поскольку не­обоснованные исследования при подозрении на неразвивающуюся беременность увеличивают нагрузку на кабинеты ультразвуковой диагностики и акушера-гинеколога и приводят к излишней невротизации пациенток, столкнувшихся с этой проблемой. Разумно придерживаться следующих рекомендаций.

  1. Если при первом ультразвуковом иссле­довании визуализируется эмбрион менее 7 мм и при этом отсутствует сердцебиение, то повтор­ное исследование назначают не ранее чем через 7 дней. Если при повторном исследовании не регистрируется сердечная деятельность, то врач правомочен поставить диагноз «неразвивающаяся беременность».
  2. Если при первом ультразвуковом иссле­довании визуализируется пустое плодное яйцо или плодное яйцо с желточным мешком внутри и его размеры > 12 мм, то повторное исследование назначают не ранее чем через 7 дней. Если при повторном обследовании эхографическая картина не меняется, то тогда правомочно ставить диагноз «неразвивающаяся беременность».
  3. Если при первом ультразвуковом иссле­довании визуализируется пустое плодное яйцо или плодное яйцо с желточным мешком внутри и его размеры <12 мм, то повторное исследование назначают не ранее чем через 14 дней. Если при повторном обследовании ситуация не меняется, то врач правомочен поставить диагноз «неразви­вающаяся беременность».

Если средний диаметр плодного яйца (сред­нее арифметическое 3 диаметров) > 16 мм и эм­брион не визуализируется, то существует 10%-ныШ шанс того, что мы имеем дело с нормальной развивающейся маточной беременностью. Если при первом трансвагинальном ультразвуковом исследовании определяется пустое плодное яйцо, а при повторном обследовании появляется изображена желточного мешка, то существует 27%-ный шанс развивающейся беременности.

При суммировании представленных данных становится очевидным, что соблюдение диагно­стических ультразвуковых критериев является необходимым фактором при оценке жизнеде­ятельности эмбриона в ранние сроки беременности. Только стандартизация методологически! подходов к диагностике, использование одни и тех же референсных шкал, правильная интер­претация полученных результатов позволит из­бежать ошибочного диагноза «неразвивающаяся беременность» и, как следствие, необоснованного прерывания большого количества желанных беременностей на ранних сроках.

Соответствие СВД ПЯ и КТР — Вопрос репродуктологу

Если вы не нашли нужной информации среди ответов на этот вопрос, или же ваша проблема немного отличается от представленной, попробуйте задать дополнительный вопрос врачу на этой же странице, если он будет по теме основного вопроса. Вы также можете задать новый вопрос, и через некоторое время наши врачи на него ответят. Это бесплатно. Также можете поискать нужную информацию в похожих вопросах на этой странице или через страницу поиска по сайту. Мы будем очень благодарны, если Вы порекомендуете нас своим друзьям в социальных сетях.

Медпортал 03online.com осуществляет медконсультации в режиме переписки с врачами на сайте. Здесь вы получаете ответы от реальных практикующих специалистов в своей области. В настоящий момент на сайте можно получить консультацию по 74 направлениям: специалиста COVID-19, аллерголога, анестезиолога-реаниматолога, венеролога, гастроэнтеролога, гематолога, генетика, гепатолога, гериатра, гинеколога, гинеколога-эндокринолога, гомеопата, дерматолога, детского гастроэнтеролога, детского гинеколога, детского дерматолога, детского инфекциониста, детского кардиолога, детского лора, детского невролога, детского нефролога, детского онколога, детского офтальмолога, детского психолога, детского пульмонолога, детского ревматолога, детского уролога, детского хирурга, детского эндокринолога, дефектолога, диетолога, иммунолога, инфекциониста, кардиолога, клинического психолога, косметолога, липидолога, логопеда, лора, маммолога, медицинского юриста, нарколога, невропатолога, нейрохирурга, неонатолога, нефролога, нутрициолога, онколога, онкоуролога, ортопеда-травматолога, офтальмолога, паразитолога, педиатра, пластического хирурга, подолога, проктолога, психиатра, психолога, пульмонолога, ревматолога, рентгенолога, репродуктолога, сексолога-андролога, стоматолога, трихолога, уролога, фармацевта, физиотерапевта, фитотерапевта, флеболога, фтизиатра, хирурга, эндокринолога.

Мы отвечаем на 96.74% вопросов.

Оставайтесь с нами и будьте здоровы!

Прогнозирование ассоциаций «лекарство-болезнь» на основе ансамблевых метапутей и разложения по сингулярным числам

BMC Биоинформатика. 2019; 20 (Carst 3): 134.

, 1 , 1, 1, 2 и 2 и 1, 9000 и 1, 3

Guangsheng Wu

1 Школа компьютерных наук, Уань Уань, Ухань, 430072 Китайская Народная Республика

Хуан Лю

1 Школа компьютерных наук, Уханьский университет, Ухань, 430072 Китайская Народная Республика

2 Сучжоуский институт Уханьского университета, Сучжоу, 215123 X00 90 Китайская Народная Республика

1 Школа компьютерных наук, Уханьский университет, Ухань, 430072 Китайская Народная Республика

3 Факультет компьютерных наук и инженерии, Университет штата Огайо, Огайо, 43210 США

5 Школа компьютерных наук , Уханьский университет, Ухань, 430072 Китайская Народная Республика

2 Сучжоуский институт Уханьского университета, Сучжоу, 215123 Китайская Народная Республика

9 0002 3 Департамент компьютерных наук и инженерии, Университет штата Огайо, Огайо, 43210 США

Автор, ответственный за переписку.
Conference

17-я Азиатско-Тихоокеанская конференция по биоинформатике (APBC 2019)

14-16 января 2019

Ухань, Китай

APBC 2019 Открытый международный доступ Эта статья распространяется на условиях лицензии Creative Commons4.0 Attribution ://creativecommons.org/licenses/by/4.0/), что разрешает неограниченное использование, распространение и воспроизведение на любом носителе при условии, что вы укажете автора(ов) оригинала и источник, а также предоставите ссылку на Креатив. Commons license и укажите, были ли внесены изменения.Отказ Creative Commons от права на общественное достояние (http://creativecommons.org/publicdomain/zero/1.0/) применяется к данным, представленным в этой статье, если не указано иное. Эта статья цитировалась в других статьях в PMC.

Abstract

Background

В области репозиционирования лекарств предполагается, что аналогичные лекарства могут лечить сходные заболевания, поэтому многие существующие вычислительные методы должны вычислять сходство лекарств и заболеваний. Однако расчет сходства зависит от принятой меры и доступных признаков, что может привести к тому, что оценки сходства резко различаются от одного к другому, и он не будет работать при наличии неполных данных.Кроме того, для методов обучения с учителем обычно требуются как положительные, так и отрицательные образцы для обучения моделей прогнозирования, тогда как в данных о парах лекарство-болезнь есть только некоторые подтвержденные взаимодействия (положительные образцы) и множество немаркированных пар. Для обучения моделей многие методы просто обрабатывают немаркированные образцы как отрицательные, что может вносить искусственные шумы. Здесь мы предлагаем метод прогнозирования ассоциаций лекарств и болезней без необходимости информации о сходстве и выбора более вероятных отрицательных образцов.

Результаты

В предлагаемом EMP-SVD (метапути ансамбля и разложение по сингулярным значениям) мы вводим пять метапутей, соответствующих различным типам данных взаимодействия, и для каждого метапути мы генерируем коммутирующую матрицу. Каждая матрица разбивается на две матрицы низкого ранга с помощью SVD, которые используются для латентных признаков лекарств и болезней соответственно. Функции объединены для представления пар лекарство-болезнь. Мы создаем базовый классификатор с помощью Random Forest для каждого метапути, и пять базовых классификаторов объединяются в окончательный классификатор ансамбля.Чтобы обучить более надежную модель прогнозирования, мы выбираем более вероятные отрицательные результаты из немеченых образцов, предполагая, что неассоциированная пара лекарств и заболеваний не имеет общих взаимодействующих белков. Эксперименты показали, что предложенный метод EMP-SVD превосходит несколько современных подходов. Тематические исследования с помощью литературных исследований показали, что предложенный EMP-SVD может выявить многие ассоциации лекарств и болезней, что подразумевает практичность EMP-SVD.

Выводы

Предложенный EMP-SVD может интегрировать данные о взаимодействии между лекарствами, белками и болезнями и прогнозировать взаимосвязь лекарств и болезней без необходимости в информации о сходстве.В то же время стратегия выбора более надежных отрицательных образцов будет способствовать предсказанию.

Ключевые слова: Репозиционирование лекарств, Разработка лекарств, Мета-путь, Коммутирующая матрица, Разложение по сингулярным числам

Предыстория

Открытие новых лекарств — сложный систематический проект, который является дорогостоящим, трудоемким и сопряжен с высоким риском неудачи. Как сообщается, потребуется 0,8–1,5 миллиарда долларов и около 10–17 лет, чтобы вывести на рынок низкомолекулярный препарат, а на этапе разработки почти 90% низкомолекулярных препаратов не могут пройти фазу I клинических испытаний и, наконец, быть ликвидировано [1, 2].Фармакологические и токсикологические свойства одобренных на рынке препаратов ясны, а их безопасность часто гарантируется, но обнаруживаются лишь некоторые из их показаний. Например, в DrugBank [3] есть 2589 утвержденных низкомолекулярных препаратов и более 25000 заболеваний в медицинской базе данных UMLS [4], что дает более 60 миллионов пар лекарство-болезнь. Однако было установлено, что только менее 5% пар «лекарство-болезнь» имеют терапевтическую взаимосвязь, а большинство взаимосвязей «лекарство-болезнь» неизвестны [5].Таким образом, обнаружение новых показаний одобренных лекарств, известное как репозиционирование лекарств, может значительно сэкономить деньги и время, особенно может повысить вероятность успеха, стало многообещающей альтернативой для разработки лекарств de novo.

Исторически сложилось так, что обнаружение нового показания к наркотику, скорее всего, было случайным событием с долей везения. Например, миноксидил, первоначально предназначенный для лечения гипертонии, случайно оказался эффективным при выпадении волос [6]; Силденафил (торговое название: Виагра), первоначально предназначенный для лечения стенокардии, иногда обнаруживал потенциал для лечения эректильной дисфункции [7].Такие случайные находки новых показаний к лекарствам предполагают новую методологию разработки лекарств. Однако подход «на удачу» не может обещать эффективного и действенного репозиционирования лекарств. Необходимо разработать вычислительный метод, помогающий перенаправить разрешенные препараты. К счастью, с накоплением множества омических данных и развитием методов машинного обучения стало возможным анализировать потенциальные показания к применению лекарств in silico. К настоящему времени было предложено множество вычислительных методов для поиска новых показаний к наркотикам путем прогнозирования потенциальных взаимосвязей лечения пар лекарство-заболевание.

На основе гипотезы о том, что сигнатура экспрессии гена конкретного лекарства противоположна сигнатуре экспрессии гена заболевания, были предложены некоторые методы, основанные на экспрессии гена [8, 9]. Заметив, что такого рода методы могут не учитывать различные роли генов и их зависимости на системном уровне, недавно был предложен системный подход, который объединяет экспрессию генов и связанную с ними сеть [10].

В последнее время, наряду с увеличением количества мультиомных данных о лекарствах и заболеваниях, было предложено множество методов для интеграции нескольких источников данных для прогнозирования взаимодействий лекарств и болезней на основе методов машинного обучения.Готлиб и др. предложил метод (PREDICT) для прогнозирования новых ассоциаций между лекарствами и заболеваниями путем интеграции данных о сходстве пяти лекарств и двух сходств заболеваний [11]. Ван и др. предложили вычислительную основу, основанную на модели трехуровневой гетерогенной сети (TL-HGBI) путем интеграции сходств и взаимодействий между заболеваниями, лекарствами и лекарственными препаратами [12]. Луо и др. использовали некоторые всесторонние сходства в отношении лекарств и болезней и предложили алгоритм Bi-Random walk (MBiRW) для прогнозирования потенциальных взаимодействий лекарств и болезней [13].Мартинес и др. разработали метод под названием DrugNet для определения приоритетов лекарств и болезней путем интеграции разнородных данных [14]. Ву и др. интегрировали всесторонние сходства между лекарствами и болезнями на уровне химического / фенотипа, уровне генов и уровне сети лечения, а также предложили полуконтролируемый метод разрезания графа (SSGC) для прогнозирования ассоциаций лекарств и болезней [15]. Могадам и др. применили метод слияния ядер, чтобы объединить различные характеристики лекарств и признаков заболевания, а затем построили модели SVM для прогнозирования показаний к новым лекарствам [16].Лян и др. интегрировала информацию о химическом составе препарата, информацию о целевом домене и информацию об аннотации онтологии генов, а также предложила лапласовский регуляризованный метод обучения разреженного подпространства (LRSSL) для прогнозирования ассоциаций лекарств и болезней [17]. Чжан и др. представил линейное сходство соседства [18] и сетевое топологическое сходство [19], затем предложил метод матричной факторизации с ограничениями по сходству (SCMFDD) для прогнозирования ассоциаций лекарство-болезнь с использованием известных ассоциаций лекарство-болезнь, характеристик лекарств и семантической информации о болезни. [20].

Однако большинство существующих методов сталкиваются с двумя основными проблемами: во-первых, большинство из них основано на гипотезе о том, что сходные лекарства лечат сходные заболевания, поэтому им нужна информация о сходстве между лекарствами, белками, болезнями и т.д. Тем не менее, данные о сходстве не могут быть легко получены. Людям часто приходится настраивать программу для сбора данных и расчета сходства, чтобы удовлетворить свои собственные потребности. Кроме того, расчет показателей сходства зависит от принятых мер, что может привести к тому, что показатель сходства пары резко различается от одного метода к другому.Например, два белка похожи по своей структуре, но могут различаться по своей последовательности. Хуже того, некоторые признаки, необходимые для вычисления подобия, могут быть неизвестны или недоступны, в результате чего эти методы не работают [21]. Другая проблема заключается в том, что для обучения моделей прогнозирования методам обучения с учителем обычно требуются как положительные, так и отрицательные образцы, в то время как в парных данных «лекарство-болезнь», как и в других биологических данных, отсутствуют экспериментально подтвержденные отрицательные образцы.Для обучения моделей большинство существующих методов случайным образом выбирают некоторые немаркированные образцы в качестве отрицательных. Очевидно, что такая стратегия является очень грубой, поскольку мы не уверены, есть ли какие-либо положительные образцы, обнаруженные в немеченых данных.

В этой статье мы предлагаем метод, названный EMP-SVD (ансамбль метапутей и разложение по сингулярным значениям), для выявления взаимосвязей лекарство-болезнь с использованием данных о взаимодействии лекарство-заболевание, лекарство-белок и заболевание-белок. В отличие от других методов, EMP-SVD вообще не нуждается в информации о сходстве.Чтобы интегрировать различные виды данных о взаимодействии и учитывать различные зависимости, мы вводим пять метапутей. Для каждого метапути мы сначала генерируем коммутирующую матрицу на основе соответствующих данных взаимодействия, а затем получаем скрытые признаки лекарств и болезней с помощью SVD (Singular Value Decomposition). Все пары лекарство-болезнь могут быть представлены признаками. Наконец, мы обучаем базовый классификатор с помощью алгоритма случайного леса. Пять базовых классификаторов объединены в ансамблевую модель для прогнозирования взаимодействия лекарства и болезни.Структура нашего метода показана на рис. . Чтобы обучить более надежную модель прогнозирования, мы отбираем наиболее вероятные отрицательные из немеченых образцов в предположении, что неассоциированная пара лекарств и болезней не имеет общих взаимодействующих белков, что отличается от других методов. Чтобы оценить предлагаемый нами метод, мы сравним его с современными методами, а также проведем тематические исследования по литературным исследованиям.

Структура предлагаемого нами EMP-SVD

Материалы и методы

Наборы данных

В этой статье мы в основном использовали данные о взаимодействии лекарство-болезнь, лекарство-белок и заболевание-белок для построения модели прогнозирования .Мы собрали такие данные из DrugBank [3, 22, 23], OMIM [24] и набора данных Готлиба [11]. Конкретно, мы собрали 4642 данных о взаимодействии лекарств с белками из DrugBank, включая 1186 лекарств и 1147 белков; 1365 взаимодействий болезни и белка из OMIM, включая 449 болезней и 1147 белков; и 1827 взаимодействий лекарств и болезней из набора данных Готтлиба, включая 302 заболевания, 551 лекарство. Очевидно, что гетерогенная сеть, состоящая из лекарств, белков, болезней и известных взаимодействий, разрежена. Статистика данных представлена ​​в таблице.

Таблица 1

Таблица 1

Информация о статистической сетевой сети препарата

Тип Недвижимость Номер (плотность)
узлы
препарат 1186
Белок 1147 1147
449 449
Известны взаимодействия Препарат ⇔ Белок 4642 (0,0034)
Болезнь ⇔ Белок 1365 (0.0027)
Лекарство ⇔ Болезнь 1827 (0,0034)

Хотя наш метод не нуждается в информации о сходстве, большинству других методов, основанных на машинном обучении, она нужна. Для удобства сравнения мы по-прежнему собирали химическую структуру лекарств и данные о последовательностях белков из DrugBank. Мы рассчитали химическое сходство между лекарственными препаратами в соответствии с их строками SMILES [25] с помощью инструмента Openbabel [26] и сходство белок-белок в соответствии с данными о последовательностях с помощью алгоритма Смита-Уотермана [27].Более того, мы напрямую загрузили сходство болезни с MimMiner [28].

Определения и обозначения

В этом разделе мы дадим формальные определения и обозначения, используемые в этой статье.

Определение 1

(схема гетерогенной сети «лекарство-белок-заболевание»). Для данного гетерогенного лекарственного белкового заболевания г = ( В, E ), где V = D P S , D , P и S — наборы узлов лекарство, белок, болезнь в сети соответственно, тогда как E = E d,p E p,d 0 E E E S, P E D D, S E S, D — это наборы гетерогенных связей в г , которые включают в себя « «связывает» связь между лекарствами и белками, «вызывает/вызывает» связь между белками и болезнями, «лечит/лечит» связь между лекарствами и болезнями.Схема G может быть определена как MG=(T,R), где T={Лекарство,Белок,Болезнь}, R={связывает,причины,вызвано,лечит,лечится}, T и R — наборы типы узлов и типы ссылок в G соответственно.

Схема сети M G служит шаблоном сети G . Для гетерогенной сети лекарство-белок-заболевание схема сети показана на рис.

Схема гетерогенной сети лекарство-белок-болезнь

Определение 2

(метапуть гетерогенной сети) На основе данной схемы гетерогенной сети MG=(T,R), P=T1→R1T2→R2…→Rk−1Tk определяется как гетерогенный сетевой метапуть в сети G , где Ti∈T, i ∈ {1,2,…, k } и Ri∈R, i ∈ {1,2,…, k −1} и если ( T 1 , T 2 ,…, T k 0 9 одинаковые) ∨ ( R 1 , R 2 ,…, R k −1 не все одинаковы).

Для простоты мы также опускаем типы ссылок в обозначении метапути, если нет множественных ссылок между двумя типами, например, P=T1→T2→…→Tk обозначает метапуть P=T1→R1T2→R2…→Rk−1Tk. Длина P – это количество звеньев в P.

Определение 3

(Коммутирующая матрица [29]) Дана сеть G =( V , E ) и ее схема сети M G коммутирующая матрица для метапути P=T1→T2→…→Tk определяется как X=AT1T2AT2T3…ATk−1Tk, где ATiTj — матрица смежности (взаимодействия) между типами T i и тип T j . x ( I , j ) представляет количество экземпляров пути между объектом U I T 1 и объект j T k под метапутем P.

Поскольку мы хотим обнаружить взаимодействие между лекарствами и болезнями, мы рассматриваем только случаи T 1 = Препарат и T k = Болезнь .

Теперь, когда в гетерогенной сети есть только три типа узлов (лекарства, белки и болезни), мы думаем, что метапуть с длиной более трех может быть слишком длинным, чтобы способствовать предсказанию. Работа Sun также показала, что короткие метапути достаточно хороши, а длинные метапути могут даже снизить качество [29]. Поэтому в этой работе мы выбрали только метапути длиной не более трех. В результате выбираем пять метапутей, описанных ниже.

Пусть

A DS DS БУМ Мэрикс взаимодействия на наркотики, A DP DP — матрица взаимодействия препарата-белков, и A SP — взаимодействие с заболеванием. матрицы, мы можем получить коммутирующие матрицы пяти метапутей следующим образом:

Мета-путь-1 : Лекарство → лечит Болезнь.Его коммутирующая матрица, обозначенная как X 1, может быть получена следующим образом:

Мета-путь-2 : Лекарство →связывается с белком →вызывает болезнь. Его коммутирующая матрица, обозначенная как X 2 , может быть получена следующим образом:

Используя мета-путь-2, мы можем интегрировать информацию о взаимодействии лекарственного средства с белком и информацию о взаимодействии болезни с белком, то есть мы легко принимаем во внимание информацию, связанную с белком.

Мета-путь-3 : Лекарство →связывается с белком →связывается с лекарством →лечит болезнь.Его коммутирующая матрица, обозначенная как X 3, может быть получена следующим образом:

Используя мета-путь-3, мы можем интегрировать информацию о взаимодействии лекарства с белком и о взаимодействии лекарства с болезнью. Более того, мета-путь-3 также указывает на то, что если два препарата имеют некоторые общие белки, они могут иметь схожие показания.

Мета-путь-4 : Лекарство →лечит болезнь →лечится лекарством →лечит болезнь. Его коммутирующая матрица, обозначенная как X 4, может быть получена следующим образом:

Используя мета-путь-4, мы можем интегрировать информацию о взаимодействии лекарства и болезни.Кроме того, мета-путь-4 также указывает на то, что если два препарата имеют общие показания, то показания для одного препарата также могут быть потенциальным показанием для другого препарата.

Мета-путь-5 : Лекарство → лечит болезнь → вызывается белком → вызывает болезнь. Его коммутирующая матрица, обозначенная как X 5 , может быть получена следующим образом:

Используя мета-путь-5, мы можем интегрировать информацию о взаимодействии лекарства и болезни и о взаимодействии болезни с белком. Более того, мета-путь-5 также указывает на то, что если два заболевания имеют общие белки, то лекарство для лечения одного заболевания может также быть потенциальным терапевтическим лекарством для другого заболевания.

как определение, элемент x Обозначает количество экземпляров пути из препарата D I к заболеванию S J по соответствующему метапути. Мы показываем пример на рис. . Есть два экземпляра пути от препарата d 3 до болезни s 2 под Мета-путь-2 , d3→p3→s2 и d3→p5→s2, таким образом, мы имеем X 2( 3,2)=2 в коммутирующей матрице X 2.

Пример значения коммутирующей матрицы

Извлечение признаков с разложением по сингулярным числам

Теперь этот элемент X ( i,j ) в коммутирующей матрице X обозначает количество экземпляров пути от лекарства D I к болезням S J J J , затем ряд I в коммутирующей матрице может быть использован в качестве особенностей препарата D I , а колонна J может быть используются как признаки болезни s j .И мы можем использовать их конкатенацию для представления пары лекарство-болезнь. Предположим, что имеется m лекарств и n болезней, у нас будет m + n (в этой работе m = 1186, n = 449) признаков для представления пары лекарство-болезнь. Напротив, количество пар лекарство-болезнь невелико (в этой работе известно только 1827 взаимодействий). Очевидно, размер признаков относительно высок, что не подходит для построения надежной модели прогнозирования.Теперь, когда разложение по сингулярным числам (SVD) успешно использовалось для уменьшения размерности во многих исследованиях, мы также использовали SVD для выделения небольшого количества признаков в нашей работе.

Используя SVD, коммутирующую матрицу X∈ℝm×n можно разложить на U , Σ и V так, что

, где U∈ℝm×m, Σ∈ℝm×n и V∈ℝn×n. Диагональные элементы Σ равны сингулярным значениям X (другие элементы Σ , кроме диагональных элементов, равны 0).Столбцы U и V являются, соответственно, лево- и право-сингулярными векторами для соответствующих сингулярных значений.

Как всем известно, величина сингулярных значений представляет важность соответствующих векторов; а в Σ сингулярные значения упорядочены по убыванию. Более того, в большинстве случаев сумма первых 10 % или даже 1 % сингулярных значений составляет более 99 % от общей суммы всех сингулярных значений. Именно в этой задаче предсказания ассоциаций лекарство-болезнь, в биомедицинском смысле, наиболее полезная информация о свойствах лекарства и болезни будет включена в первые 10% даже меньше единичных значений.В процессе уменьшения размерности полезные данные не будут потеряны, а избыточная информация будет отброшена. Другими словами, мы можем использовать верхние r сингулярных значений для аппроксимации матрицы X :

где r мин ( m,n ).

ROW I в U Может использоваться как скрытые особенности препарата D I , и ROW J в V могут использоваться как скрытые особенности заболевания S J .В результате размерность вектора латентных признаков каждой пары лекарство-болезнь может быть уменьшена до 2∗ r . В этой работе мы введем параметр lant_feature_percent , намного меньший 1 (скажем, 1%, 2%,…), чтобы управлять значением r таким образом, чтобы r = м, п ).

Выбор вероятных отрицательных образцов из немаркированных пар лекарство-болезнь

Чтобы построить модель прогнозирования с помощью обучения с учителем, нам нужны как положительные, так и отрицательные образцы.Известные отношения лечения наркотиков и лечения являются положительными образцами. Из-за отсутствия проверенных отрицательных образцов большинство методов просто случайным образом выбирают некоторые из немаркированных образцов в качестве отрицательных. Однако немеченые образцы не обязательно являются отрицательными, некоторые из них могут быть положительными образцами, которые до сих пор остаются непокрытыми экспериментами [30]. В отличие от других методов, в этой работе мы пытаемся найти более надежные отрицательные образцы среди немеченых.

Если лекарство имеет общие белки с болезнью, то лекарство может иметь потенциал для лечения болезни.Интуитивно, если лекарство и болезнь не имеют общих родственных белков, мы можем подумать, что болезнь не является показанием для лекарства, и, таким образом, пара лекарство-болезнь, скорее всего, является отрицательной выборкой. Таким образом, мы можем выбрать более надежные отрицательные образцы из немеченых пар на основе информации о взаимодействиях лекарство-белок и белок-болезнь. Процедура указана в Алгоритме 1.

Построение и набор классификаторов

Пять метамаршрутов, которые мы выбрали для интеграции разнородных данных, отражают различные аспекты взаимосвязи лекарства и лечения заболевания, например, два препарата с общими белками, имеющие сходные показания, два препарата, имеющие одно общее показание, также имеют другое показание и так далее.Таким образом, мы можем построить пять базовых классификаторов для предсказания взаимосвязей между наркотиками и лечением болезни с разных сторон. В нашей работе базовые классификаторы построены на основе алгоритма Random Forest, который был реализован с использованием функции RandomForestClassifier в пакете scikit-learn [31], мы установили количество деревьев равным 256.

Поскольку обучение ансамбля может часто помогают улучшить производительность [32, 33], после построения пяти базовых классификаторов мы можем получить классификатор ансамбля.Для ввода пары лекарство-болезнь каждый базовый классификатор выводит две вероятности, указывающие на то, что пара является отрицательной и положительной соответственно. Поскольку мы хотим знать, имеет ли пара отношения лечения, мы берем только положительную вероятность, рассматриваемую в модели ансамбля.

Для пары лекарство-болезнь x с неизвестной меткой предположим, что прогнозируемая оценка (вероятность) каждого базового классификатора равна ч i ( x ), i =1,2,…5, мы использовали среднюю стратегию, чтобы получить окончательную оценку модели ансамбля:

Если H ( x ) больше заданного порога, то выборка x прогнозируется как положительная. Поскольку F 1 -мера является всеобъемлющей метрикой, в этой работе мы позволяем программе автоматически определять пороговое значение, когда F 1 -мера достигает максимального значения, что является той же стратегией, что и у других исследователей. использовал.

Эксперименты и результаты

Мы проводим 5-кратную перекрестную проверку для оценки нашего метода. Поскольку отфильтрованных отрицательных выборок больше, чем положительных, мы случайным образом выбираем из них подмножество, размер которого равен положительным, и используем сбалансированные данные для обучения моделей. Сначала мы выбираем подходящее количество функций в соответствии с соотношением производительности модели и количества функций. Затем мы провели три вида оценочных экспериментов: (1) мы исследовали, может ли наша стратегия фильтрации отрицательных выборок помочь улучшить эффективность прогнозирования; (2) мы сравниваем EMP-SVD с другими современными методами, используя те же данные; (3) Мы проверяем практичность нашего метода, проводя тематические исследования.

Показатели оценки

Как и в большинстве других работ, в экспериментах мы выполнили 5-кратную перекрестную проверку. Для оценки эффективности метода существуют некоторые общие показатели: точность ( PRE ), полнота ( REC ), точность ( ACC ), коэффициент корреляции Мэтьюза ( MCC ) и F 1 — мера ( F 1 ). Их можно рассчитать по следующим уравнениям:

MCC=TP×TN−FP×FN(TP+FP)(TP+FN)(TN+FP)(TN+FN)

12

где TP , FP , TN и FN обозначают количество истинно положительных образцов, ложноположительных образцов, истинно отрицательных образцов и ложноотрицательных образцов соответственно.

Так как Precision( PRE ) и Recall( REC ) имеют некоторые конфликты, в общем, классификатор получает более высокий PRE будет иметь более низкий REC , и наоборот. Чтобы получить всестороннюю производительность, часто используются кривая площади под кривой точного возврата ( AUPR ) и площадь под кривой рабочей характеристики приемника ( AUC ). AUPR учитывает как PRE , так и REC , AUC принимает во внимание как истинные положительные значения ( TPR , то же, что и REC ), так и ложноположительные значения ( FPR , поэтому) они являются всеобъемлющими показателями.В то же время с помощью кривых мы можем интуитивно определить, какой классификатор лучше. Поэтому в данной работе в качестве основных метрик мы приняли AUPR и AUC .

Определение подходящего количества признаков

Параметры часто используются в существующих вычислительных методах, что ограничивает обобщение модели. Так что лучше использовать меньше параметров или получить аналитическое решение.

В этой работе нам просто нужно определить количество сингулярных значений (соответствующих номеру признака, который контролируется параметром latent_feature_percent ) во время построения модели, который сильно отличается от большинства современных методы.Только что упомянутое выше r min ( m,n ), поэтому мы установили latent_feature_percent как 1%, 2%, 3%, ……, 20% соответственно, и кривые производительности пять базовых классификаторов и один ансамблевый с разными latent_feature_percent показаны на рис. Результаты показали, что характеристики классификатора ансамбля лучше, чем у других пяти базовых классификаторов, что свидетельствует об эффективности нашего правила ансамбля. Кроме того, характеристики шести классификаторов устойчивы при различных настройках параметров.Так или иначе, мы установили latent_feature_percent как 3% в соответствии с кривыми в этой работе.

Влияние различных lant_feature_percent на a AUPR b AUC

Мы также обнаружили, что характеристики классификаторов, основанных на мета-пути-1 и мета-пути-4, являются худшими. Заметив, что и мета-путь-1, и мета-путь-4 учитывают только взаимодействие лекарство-болезнь, в то время как три других мета-пути содержат больше информации о взаимодействии лекарство-белок или белок-болезнь, мы думаем, что интегрировать больше информации о взаимодействии в мета-путь может помочь улучшить производительность классификатора.

Исследование стратегии фильтрации отрицательных образцов

Из-за отсутствия проверенных отрицательных образцов большинство других методов случайным образом выбирают немеченые образцы как отрицательные. Однако немеченые образцы не обязательно являются отрицательными, некоторые из них могут быть положительными образцами, еще не обнаруженными экспериментами. Поэтому в этой работе мы отобрали наиболее вероятные отрицательные образцы из немеченых в соответствии с общей информацией о белке (как описано в Алгоритме 1). Как показано в таблице, все классификаторы достигают лучших результатов по большинству показателей при использовании нашей стратегии фильтрации отрицательных выборок.Мы также отметили, что улучшение незначительное, что может быть связано с тем, что известных взаимодействий лекарство-белок и взаимодействий белок-болезнь слишком мало (с плотностью 0,0034 и 0,0027, как показано в таблице), в результате чего очень немногие белки могут использоваться в процессе фильтрации. В любом случае, наша стратегия отбора более надежных отрицательных образцов полезна, осуществима и интерпретируема. Мы считаем, что наряду с увеличением данных о взаимодействиях мы получим более надежные отрицательные образцы и, таким образом, добьемся более значительных улучшений производительности.

Таблица 2

Таблица 2

Сравнение спектаклей с различными отрицательными образцами. ACC MCC F1 9019 Надежный Random Надежный Random Надежный Random Random Надежный Random Надежный Надежный мета-путь-1 0.894 0,896 0,859 0,861 0,786 0,771 0,875 0,891 0,835 0,835 0,673 0,677 0,827 0,826 мета-пути-2 0,930 0.936 0.925 0.928 0.873 0.850 0.839 0.873 0.8750 0.850 0.761 0.702 0.722 0,855 0,860 мета-путь-3 0,921 0,926 0,902 0,905 0,826 0,832 0,862 0,883 0,843 0,858 0,690 0,719 0.842 0.855 0.894 0.895 0.858 0.858 0.782 0.782 0.790 0.882 0,867 0,836 0,832 0,676 0,667 0,828 0,826 мета-пути-5 0,918 0,920 0,892 0,895 0,809 0,800 0.900 0.925 0.859 0.865 0.721 0.737 0.852 0.852 0.858 0.858 0.954 0.956 0,949 0,951 0,924 0,913 0,837 0,854 0,871 0,876 0,745 0,755 0,878 0,882

Сравнение с другими методами

В этом В разделе мы сравниваем EMP-SVD с современными методами, чтобы продемонстрировать превосходную эффективность нашего метода. PREDICT [11] и метод TL-HGBI [12] являются классическими методами, используемыми для прогнозирования взаимодействий лекарство-мишень и лекарство-болезнь.MBiRW [13], LRSSL [17] и SCMFDD [20] — это методы, предложенные за эти два года и достигшие высоких результатов в прогнозировании взаимодействия лекарства и болезни. Поэтому мы выбираем эти современные методы для сравнения.

PREDICT вычисляет количество баллов для данной пары лекарство-болезнь ( d r , d i ) в соответствии со всеми известными парами лекарство-болезнь, связанными с dr’di пара по уравнению Score(dr,di)=maxdr’,di’≠dr,diSdr,dr’×Sdi,di’, где Sdr,dr’ — сходство между лекарствами, а Sdi,di’ — сходство между заболеваниями.TL-HGBI — это трехслойная гетерогенная сетевая модель, в которой используются сходства и взаимодействия лекарств, болезней и целей путем итеративного обновления. MBiRW регулирует сходство лекарств и болезней с помощью корреляционного анализа и известных ассоциаций лекарств и болезней, а затем использует алгоритм Bi-random walk для прогнозирования потенциальных ассоциаций лекарств и болезней. LRSSL — это лапласовский регуляризованный метод обучения разреженных подпространств, используемый для прогнозирования ассоциаций лекарство-болезнь, который объединяет информацию о химическом составе лекарственного средства, информацию о целевой области лекарственного средства и информацию о целевой аннотации.SCMFDD — это метод матричной факторизации с ограничениями по сходству для прогнозирования ассоциаций «лекарство-болезнь» с использованием известных взаимодействий «лекарство-болезнь», характеристик лекарств и семантической информации о болезни.

Мы получили исходный код PREDICT, TL-HGBI и SCMFDD от авторов, код MBiRW, LRSSL находится в открытом доступе, и параметры были установлены согласно их документам. Параметр latent_feature_percent в EMP-SVD был установлен на 3%. Чтобы быть справедливым, данные пяти частей были сохранены в одном и том же разделе во всех методах при проведении 5-кратной перекрестной проверки.

Как показано в таблице , по сравнению с пятью другими современными методами, которые используют несколько видов подобия, а также данные о взаимодействии, предлагаемый классификатор EMP-SVD использует только известные данные о взаимодействии, но обеспечивает более высокие характеристики. в большинстве показателей, особенно в комплексных показателях (AUPR и AUC). Чтобы сделать его более интуитивно понятным, мы построили кривую Precison-Recall и кривую ROC, которые показаны на рис. a и b соответственно. AUPR и AUC предлагаемого ЭМИ-СВД равны 0.956 и 0,951 соответственно, что лучше сравниваемых методов. Следовательно, это показывает простоту и эффективность нашего метода.

A Precision-Recall Curve B ROC Curve из EMP-SVD и сравнивания методов

Таблица 3

Выступления предлагаемых EMP-SVD и современных методов

Методы AUPR AUC PRE REC ACC MCC Ф 1
ЭМП-СВД 0.956 +0,951 0,913 0,854 0,876 0,755 0,882
PREDICT 0,908 0,895 0,809 0,850 0,830 0,662 0,828
TL -HGBI 0.852 0.846 0.829 0.829 0,750 0,774 0.552 0.552 0.787
Lrssl 0.881 0.861 0,864 0,732 0,770 0,553 0,790
SCMFDD 0,836 0,854 0,926 0,713 0,774 0,575 0,805
MBiRW 0.952 0.942 0.942 0.867 0.901 0.884 0,869 0,869 0.884 0.884 0.884

Технические исследования

Здесь мы тестируем практичность EMP-SVD для прогнозирования неизвестных ассоциаций.За исключением обучающей выборки, состоящей из известных 1827 ассоциаций «лекарство-заболевание» и 1827 случайно выбранных отрицательных образцов с использованием нашей стратегии, мы использовали обученную модель EMP-SVD для прогнозирования ассоциаций для других неизвестных пар «лекарство-заболевание» и подтвердили результаты литературными данными. изучение.

Новые предсказанные 20 основных ассоциаций между наркотиками и болезнями показаны в таблице . Мы тщательно проверили их с помощью литературной проверки и обнаружили, что 13 из 20 наиболее предсказанных ассоциаций были описаны в литературе.И этих предсказанных ассоциаций изначально не было в нашем наборе данных, но мы смогли найти их с помощью нашего метода, тем самым показав практичность предложенного нами ЭМИ-СВД.

Таблица 4

Таблица 4

Прогнозируемые ассоциации наркотиков (TOP 20)

RING Оценка Drugbank ID Наркотик Наркотики ID Имя наркотика Omim ID Имя заболеваний Увеличение литературы 1 0.994 DB00776 DB00776 Окскарбазепин 239350 Гиперфосфатемия, полиурия и судороги [38] 2 0.992 DB01234 Дексаметазон 151590 Lichen Sclerosus Et Atrophicus; LSA [39] [39] 3 0,991 DB00443 Betamethasone Betamethasone 233810 Задержка роста, небольшие и опухшие руки и ноги, а экзема [36] 4 0,991 DB00694 Даунорубицин 236000 Лимфома Ходжкина [40, 41] 54 54987 DB01234 Дексаметазон 146850 Иммуноподавление; [42] [42] 6 0,986 DB01013 Clobetasol Pripionate 233810 233810 Маленькие и опухшие руки и ноги и Eczema Na 7 7 0,986 DB00620 Триамцинолон 125600 Черный папулезный дерматоз N.A. 8 0,986 DB00863 Ranitidine 600263 600263 600263 [43] [43] 9 0,985 DB00620 Triamcinolone 233810 233810 233810 233810 233810 Задержка роста, маленькие и опухшие руки и ноги, а Eczema [34, 35] 9 DB00694 DB00694 DAUNORUBICICIN 267730 267730 [44] 11 0.984 DB00694 Даунорубицин 109543 лейкоз, хронический лимфоцитарный, Восприимчивость к, 2 Н.А. 12 0,984 DB00773 Этопозид 247640 лимфобластный лейкоз, острый, с лимфоматозных Функции; Лалл [45, 46] 9 0,984 DB00214 DB00214 Торасмид 256370 256370A. 14 0,983 DB00443 Бетаметазон 188030 Тромбоцитопеническая пурпура, аутоиммунная пурпура; Аитп [47] 15 0,981 DB00444 Тенипозид 601626 Миолейкемия; AML [48, 49] [48, 49] 9 0,981 DB00481 Raloxifene Raloxifene 215470 215470 Chorioretinal дистрофия, Спиноцеребельярная атаксия и гипогонадотропные Н.A. 17 0,980 DB00335 Atenolol 608622 [50] [50] 18 0,980 DB00612 BISOROLOL 608622 Гипертония, диастолическая, устойчивость к [51] [51] [51] 19 0,980 DB00443 Betamethasone Betamethasone 146850 Иммуновое подавление; Есть Н.A. 2019 20 0,980 DB01177 IDArubicin 109543 109543 Лейкемия, хроническая лимфоцитарная, восприимчивость к, 2 Na Na

Следует отметить, что Triamcinolone (ID EardBank ID: DB00620) и бетаметазон (идентификатор DrugBank: DB00443) в качестве глюкокортикоидов обычно используются при лечении различных кожных заболеваний, таких как «экзема» [34–36], и мы обнаружили, что их предсказанные ассоциации включают заболевание «задержка роста, малые и опухшие Руки, ноги и экзема» (OMIM ID:233810).В процессе проверки литературы мы также находим случай задержки роста и синдрома Кушинга из-за чрезмерного применения мази бетаметазон-17-валерат [37]. Со всей ответственностью мы считаем, что можно ли их использовать для лечения болезни «задержка роста, маленькие и опухшие руки и ноги и экзема», или использование и дозировка должны быть дополнительно тщательно изучены химиками и врачами, особенно должны быть с осторожностью при использовании на детей и беременных женщин.

Более подробно мы проверили предполагаемые потенциальные показания к применению препарата «Амитриптилин» (ID в банке лекарств: DB00321). Амитриптилин представляет собой трициклический антидепрессант, который часто используется для лечения симптомов депрессии под торговой маркой: Ванатрип, Элавил, Эндеп. Как показано в таблице, мы можем найти литературные данные, подтверждающие 8 заболеваний из 10 основных прогнозов для амитриптилина.

Таблица 5

7

Топ 10 прогнозов для препарата «Amitriptyline»

0123.880 9
Ранг оценка Omim ID Имя заболевания Валидация литературы
1
1
1
1
1
102300 Синдром беспокойных ног, предрасположенность к, 1; RLS1 [52]
0,877 0,877 200170 200170 200170 акантхоз Nagricans с мышечными судорогами и расширением акрара N.A.
3 0,843 143465 143465 9024 Adhd [53]
4 0,837 600631 Энурез, ночной, 1; Enur1 [54]
5 0.837 600808 Энурез, ночной, 2; Enur2
6 0,817 0.817 608088 Нейропатия, наследственные сенсорные и вегетарианские, тип I, с кашлем и гастроэзофагеатом Reffull [55]
7 0,803 145590 Кожная гипертермия с головными болями и тошнотой [56]
8 0,774 164230 Обсессивно-компульсивное расстройство; Окд Н.A.
9 0,769 167870 Паническое расстройство 1; Pand1 [57]
10 0,745 600082 Гиперплазия предстательной железы, доброкачественная; Bph [58]

Рак молочной железы — относительно распространенная злокачественная опухоль у женщин, представляющая серьезную опасность для здоровья и безопасности жизни женщин. Обнаружение потенциальных наркотиков имеет большое значение. Поэтому мы также проверили список лекарств, которые, как было предсказано, лечат болезнь «Рак молочной железы» (OMIM ID: 114480).Из 10 лучших препаратов, как показано в таблице, мы обнаружили, что 8, как сообщалось, использовались в клиническом лечении.

Таблица 6

Top 10 прогнозы для заболевания «Рак молочной железы»

0.884 9.2008

Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

Двойной автоэнкодер и оптимизация функций на основе разложения по сингулярным числам для сегментации опухоли головного мозга по изображениям МРТ | BMC Medical Imaging

  • Умамахесвари К., Раджеш П., Шриниваса Рао С., Винодх Бабу П.Применение методологии сегментации для извлечения МРТ опухоли головного мозга с должным уменьшением шума. В: 2015 международная конференция по вычислительному интеллекту и сетям связи.

  • Дипти Мурти Т.С., Садашиваппа Г. Сегментация опухоли головного мозга с использованием определения порога, морфологических операций и выделения признаков опухоли. В: 2014 международная конференция по достижениям в области электроники, компьютеров и связи (ICAECC).

  • Донглиана М., Деб Д., Хэндик М., Рой С.Автоматическая сегментация опухоли головного мозга на МРТ: гибридный многоуровневый порог и набор уровней. В: 2015 международный симпозиум по передовым вычислениям и связи (ISACC).

  • Salwe S, Raut R, Hajare P. Обнаружение пикселей опухоли головного мозга с использованием пороговой обработки гистограммы на основе адаптивного вейвлета и тонкого окна. Опубликовано: Международная конференция по информационным технологиям (InCITe) 2016 г. — ИТ-саммит нового поколения.

  • Парвин А.С. Обнаружение опухоли головного мозга на изображениях МРТ с использованием комбинации нечетких C-средних и SVM.В: 2015 2-я международная конференция по обработке сигналов и интегрированным сетям (СПИН).

  • Нанди А. Обнаружение опухоли головного мозга человека с помощью сегментации изображений МРТ и морфологических операторов. В: 2015 Международная конференция IEEE по компьютерной графике, зрению и информационной безопасности (CGVIS).

  • Абдулбаки Х.С., Джафри М.З.М., Муттер К.Н., Абуд Л.К., Мустафа ISB. Сегментация и оценка объема опухоли головного мозга на изображениях компьютерной томографии с использованием скрытого марковского алгоритма максимизации случайного поля.В: 2015 студенческая конференция IEEE по исследованиям и разработкам (SCORED).

  • Гальдер А., Прадхан А., Датта С.К., Бхаттачарья П. Извлечение опухоли из изображений МРТ с использованием динамического генетического алгоритма на основе сегментации изображения и морфологической операции. В: Международная конференция по связи и обработке сигналов, 6–8 апреля 2016 г., Индия.

  • Рашид MHO, Мамун М.А., Хоссейн М.А., Уддин М.П. Выявление опухоли головного мозга с использованием анизотропной фильтрации, SVM-классификатора и морфологической операции по МР-изображениям.В: 2018 международная конференция по компьютерной, коммуникационной, химической, материалотехнической и электронной инженерии (IC4ME2).

  • Мэтью А.Р., Анто П.Б. Обнаружение опухоли и классификация МРТ-изображения головного мозга с использованием вейвлет-преобразования и SVM. В: Международная конференция по обработке сигналов и связи (ICSPC’17) — 28 и 29 июля 2017 г.

  • Кумар А., Ашок А., Ансари М.А. Классификация опухолей головного мозга с использованием гибридной модели классификатора PSO и SVM. В: Международная конференция по достижениям в области вычислений, управления связью и сетей (ICACCCN2018).

  • Цуй Б., Се М., Ван С. Перенос обучения глубокой сверточной нейронной сети в метод сегментации на основе SVM для опухоли головного мозга. Опубликовано: 11-я международная конференция IEEE по передовым информационным технологиям, 2019 г.

  • Селвати Д., Селварадж Х. Сегментация тканей опухоли головного мозга на МРТ-изображениях с использованием преобразований с несколькими разрешениями и классификатора случайного леса с техникой adaboost. In: 2018 26-я международная конференция по системной инженерии (ICSEng).

  • Шах Н., Зиауддин С., Шахид А.Р.Сегментация и классификация опухолей головного мозга с использованием каскадных лесов случайных решений. В: 2017 14-я международная конференция по электротехнике/электронике, компьютеру, телекоммуникациям и информационным технологиям (ECTI-CON).

  • Ma C, Luo G, Wang K. Конкатенированные и связанные случайные леса с многомасштабной моделью активного контура, управляемой патчами, для автоматизированной сегментации опухоли головного мозга на МРТ-изображениях. IEEE Trans Med Imaging. 2018;37(8):1943–54.

    Артикул Google ученый

  • Мадхесваран М., Дхас М.С.Ловкий наивный байесовский подход к анализу последовательностей для предсказания МРТ-изображения опухоли головного мозга. В: Пятая международная конференция по вычислительным, коммуникационным и сетевым технологиям (ICCCNT).

  • Гальдер А., Добе О. Обнаружение опухоли головного мозга на основе метода К-средних и опорных векторов. В: 2017 международная конференция по достижениям в области вычислительной техники, связи и информатики (ICACCI).

  • Wasule V, Sonar P. Классификация МРТ головного мозга с использованием SVM и классификатора KNN.В: 2017 г. 3-я международная конференция IEEE по зондированию, обработке сигналов и безопасности (ICSSS).

  • Havaei M, Jodoin PM, Larochelle H. Эффективная интерактивная сегментация опухоли головного мозга как внутримозговая классификация kNN. В: 2014 22-я международная конференция по распознаванию образов.

  • Сарасвати Д., Прия Б.Л., Лакшми Р.П. Сегментация и классификация опухоли головного мозга с использованием самоорганизующейся карты. Опубликовано: Международная конференция IEEE 2019 г. по системам, вычислениям, автоматизации и сетям (ICSCAN).

  • Amarapur B. Автоматизированный подход к идентификации опухоли головного мозга с использованием классификатора ANN. В: Международная конференция по современным тенденциям в области компьютеров, электротехники, электроники и связи (ICCTCEEC-2017).

  • Читамбарам Т., Перумал К. Сегментация опухоли головного мозга с использованием генетического алгоритма и методов ИНС. В: Международная конференция IEEE по энергетике, управлению, сигналам и приборостроению (ICPCSI-2017).

  • Кумар В., Сачдева Дж., Гупта И., Ханделва Н., Ахуджа К.К.Классификация опухолей головного мозга с использованием PCA-ANN. В: 2011 Всемирный конгресс по информационным и коммуникационным технологиям.

  • Калайвани И., Оливер А.С., Пугаленти Р. Сегментация опухоли головного мозга с использованием классификатора машинного обучения. В: 2019 г. пятая международная конференция по науке, технологиям, инженерии и математике (ICONSTEM).

  • Мачхейл К., Нандпуру Х.Б., Капур В., Коста Л. МРТ-классификация рака головного мозга с использованием гибридного классификатора (SVM-KNN). В: 2015 международная конференция по промышленному КИПиА (ICIC).Инженерный колледж Пуны, Индия. 28–30 мая; 2015.

  • Хашеми Б., Уджемия С., Алим Ф., Седдики С., Талби Ф., Абдельазиз М. Выявление церебральных аномалий с помощью сегментации растущей области и классификации KNN. В кн.: Пятая международная конференция по инновационным вычислительным технологиям (INTECH 2015).

  • Перейра С. и др. Сегментация опухоли головного мозга с использованием сверточных нейронных сетей на МРТ-изображениях. IEEE Trans Med Imaging. 2016;35(5):1240–51.

    Артикул Google ученый

  • Ян А, Ян Х, Вэньруй В, Лю Х, Чжуансун Ю.Исследование по извлечению признаков изображения опухоли на основе сверточной нейронной сети. Специальный раздел о новых тенденциях в обработке и анализе сигналов мозга. IEEE-доступ. 2019;7:24204–13.

    Артикул Google ученый

  • Hu K, Gan Q, Zhang Y, Deng S, Xiao F, Huang W, Cao C, Gao X. Сегментация опухоли головного мозга с использованием многокаскадных сверточных нейронных сетей и условного случайного поля. IEEE-доступ. 2019;7:–29.

    Артикул Google ученый

  • Хаваи М., Дэви А., Уорд-Фарли Д.Сегментация опухоли головного мозга с помощью глубоких нейронных сетей. Мед имидж анал. 2017;35:18–31.

    Артикул Google ученый

  • Хан К., Рундо Л., Араки Р., Нагано Й., Фурукава Й., Маури Г., Накаяма Х., Хаяши Х. Объединение GAN «шум-изображение» и «изображение-к-изображению»: усиление МРТ-изображения головного мозга для обнаружения опухолей. IEEE-доступ. 2019. https://doi.org/10.1109/ACCESS.2019.26.

    Артикул Google ученый

  • Немаа С., Дудханеа А., Муралаа С., Найду С.RescueNet: непарный GAN для сегментации опухоли головного мозга. Биомедицинский сигнальный контроль процесса. 2020;55:101641.

    Артикул Google ученый

  • Cirillo MD, Abramian D, Eklund A. Vox2Vox: 3D-GAN для сегментации опухоли головного мозга. arXiv: 2003.13653v3 [cs.CV]; 2020.

  • Liu Z, Chen L, Tong L, Zhou F, Jiang Z, Zhang Q, Shan C, Zhang X, Li L, Zhou H. Сегментация опухоли головного мозга на основе глубокого обучения: опрос. Файлы класса J Latex.2015;14(8):25–46.

    Google ученый

  • Baur C, Denner S, Wiestler B, Albarkouni S, Navab N. Автоэнкодеры для неконтролируемой сегментации аномалий на МРТ-изображениях головного мозга: сравнительное исследование. Файлы класса J Latex. 2015;14(8):71–87.

    Google ученый

  • Цзэн Х, Стайб Л.Х., Шульц Р.Т., Дункан Дж.С. Сегментация и измерение коры головного мозга по трехмерным МРТ-изображениям с использованием распространения связанных поверхностей.IEEE Trans Med Imaging. 1999;18:927–37.

    КАС Статья Google ученый

  • Wanga N, Chena C, Xiea Y, Maa L. Обнаружение аномалии опухоли головного мозга с помощью скрытой регуляризованной состязательной сети. Компьютерное зрение и понимание изображений; 2020.

  • Расшифровка пространства клинических биомаркеров COVID-19: изучение методов отбора признаков на основе матричной факторизации

    Abstract

    Одной из наиболее важных задач в лечении сложных заболеваний, таких как COVID-19, является создание интеллектуальной системы сортировки, которая может оптимизировать процесс принятия клинических решений во время глобальной пандемии.Клиническая картина и характеристики пациентов обычно используются для выявления тех пациентов, которые нуждаются в более интенсивной терапии. Тем не менее, клинические данные показывают неудовлетворенную потребность в определении более точных и оптимальных клинических биомаркеров для сортировки пациентов в таких условиях, как кризис COVID-19. Здесь мы представили подход машинного обучения для поиска группы клинических показателей из анализов крови набора пациентов с COVID-19, которые позволяют прогнозировать плохой прогноз и заболеваемость. Наш подход состоит из двух взаимосвязанных схем: выбора признаков и классификации прогнозов.Первый основан на различных методах матричной факторизации (MF), а второй выполняется с использованием алгоритма случайного леса. Наша модель показывает, что газы артериальной крови (ABG) O 2 Насыщение и C-реактивный белок (CRP) являются наиболее важными клиническими биомаркерами, определяющими плохой прогноз у этих пациентов. Наш подход прокладывает путь к созданию количественных и оптимизированных систем клинического ведения COVID-19 и подобных заболеваний.

    1 Введение

    С появлением коронавирусной болезни 2019 (COVID-19) важным вопросом стало принятие клинических решений для оказания наилучшей медицинской помощи пациентам с этим заболеванием.На сегодняшний день во всем мире зарегистрировано более 180 миллионов случаев заболевания COVID-19 и 3 900 000 смертей из-за него [1]. COVID-19 — сложное заболевание, поражающее различные системы органов, и его клинические проявления включают широкий спектр симптомов и признаков [2, 3]. С другой стороны, клиническое течение заболевания представляет собой сложное явление, которое может привести к летальному исходу у части больных даже при отсутствии у них какой-либо сопутствующей патологии. Считается, что пожилой возраст, сопутствующие хронические заболевания и данные визуализации ухудшают прогноз, но сами по себе они не могут предсказать течение заболевания и прогноз на основании клинических наблюдений в различных популяциях пациентов [4, 5, 6, 7, 8]. , 9, 10].Заболевание может вызывать ряд острых или хронических осложнений, которые могут изменить траекторию прогрессирования заболевания и его исход [3, 4, 11].

    В эпоху системной медицины методы машинного обучения (МО) и искусственного интеллекта (ИИ) могут применяться для принятия клинических решений [12]. Аналитика больших данных в системной медицине для этой цели сталкивается с двумя основными проблемами. Первая проблема заключается в сохранении геометрических свойств исходных данных в процессе уменьшения размерности данных.Хотя предполагается, что исходные данные отбираются на многообразии высокой размерности, а функция методов редукции рассматривается как отображение этих данных на подмногообразие более низкой размерности таким образом, что локальная геометрия всех данных все еще включена в уменьшенные данные. Вторая проблема связана с шумами и выбросами в большинстве клинических данных, негативное влияние которых на анализ данных следует уменьшить или эффективно контролировать. В системной фармакологии предпринимались попытки решить эти проблемы с помощью методов отбора признаков, основанных на матричной факторизации (МФ) [13].

    Для решения проблемы отсутствия геометрических свойств при уменьшении размерности и смягчения разрушительного влияния выбросов и шумов на данные до настоящего времени было предложено множество методов и инструментов уменьшения. В качестве примечательного примера, категория методов обучения подпространств привлекла значительное внимание из-за замечательной способности таких методов работать с наборами данных большой размерности, такими как наборы данных экспрессии генов. Обучение подпространству — это метод уменьшения размерности, который может создать низкоразмерное представление из исходных многомерных данных.Этот метод можно комбинировать с другими методами, такими как MF, множественное обучение и корреляционный анализ, чтобы выполнять как извлечение, так и выбор признаков с превосходной производительностью.

    Успешным примером идеи обучения подпространств при неконтролируемом выборе признаков является метод матричной факторизации признаков (MFFS) [14]. Он выполняет выбор признаков итеративно, используя алгоритм, основанный на неотрицательной матричной факторизации и расстоянии подпространства. Хотя MFFS удалось перенести матричную факторизацию из мира извлечения признаков во вселенную выбора признаков, она не смогла учесть корреляции между признаками.Последнее приводит к подмножеству функций с избыточностью. Ци и др. [15] решили проблему избыточности, введя новый неконтролируемый метод выбора признаков, называемый Выбором признаков регуляризованной матричной факторизации (RMFFS). RMFFS использует член регуляризации, который представляет собой комбинацию L 1 -норма и L 2 -норма, при оптимизации целевой функции матричной факторизации. Этот подход приводит к подмножеству признаков с низкой избыточностью (т. е. линейной независимостью) и хорошим представлением исходных многомерных данных.В качестве альтернативы Wang et al. [16] представили максимальную проекцию и минимальную избыточность (MPMR) в качестве еще одного метода обучения подпространства без учителя, чтобы уменьшить избыточность в выбранных функциях. MPMR формализует выбор признаков как отображение из пространства признаков в подпространство признаков с использованием проекционной матрицы с ограничением минимальной ошибки реконструкции. Затем поиск проекционной матрицы переформулируется как задача матричной факторизации, которая решается с помощью жадного алгоритма. Чтобы выбрать низкую избыточность подмножества признаков, добавляется член регуляризации, который включает коэффициент корреляции Пирсона между признаками.Ни один из перечисленных методов не сохраняет геометрическую структуру признаков. Чтобы решить эту проблему, Shang et al. [17] представили метод регуляризованного выбора признаков на основе обучения в подпространстве (SGFS). SGFS включает регуляризацию графа в изучение подпространства, создавая карту признаков в пространстве признаков. Однако этот метод сохраняет только геометрическую структуру многообразия признаков. Чтобы сохранить геометрические структуры объектов и массивов данных, Шанг и др.[18] разработали новый метод выбора признаков, названный Sparse and Low-redundant Subspace Learning-based Dual-graph Regularized Robust (SLSDR). SLSDR включает графы функций и данных (двойной граф) в обучение подпространства, чтобы выбрать подмножество функций, которое лучше всего сохраняет геометрические структуры как функций, так и коллекторов данных. Репрезентативность и низкая избыточность подмножества функций гарантируются в SLSDR через член регуляризации внутреннего продукта. Это реализовано в матрице выбора признаков, что приводит к разреженным строкам и корреляциям между рассматриваемыми признаками.Кроме того, SLSDR устойчив к выбросам, что достигается путем наложения L 2,1 -нормы на остаточную матрицу обучения подпространства.

    Целью этой статьи является пересмотр MFFS, MPMR, SGFS, RMFFS и SLSDR и изучение их применения в двух категориях биомаркеров и клинических данных. Во-первых, проанализировать десять наборов данных экспрессии генов для методов отбора генов. Во-вторых, изучить набор клинических данных COVID-19, извлекая его прогностические признаки, и представить модель для обнаружения клинических признаков плохого прогноза при COVID-19.Основной целью использования упомянутых выше методов является их высокая производительность при решении задач выбора признаков. Чтобы быть точным, механизм выбора признаков, разработанный для MFFS, продемонстрировал свою высокую эффективность и продуктивность, так что широкая категория методов была основана на структуре MFFS. MPMR, SGFS, RMFFS и SLSDR попадают в эту категорию и улучшают производительность MFFS с разных точек зрения, используя разные инструменты. Эти мощные инструменты для разработки методов выбора признаков включают изучение подпространства, факторизацию неотрицательной матрицы, многообразное обучение и корреляционный анализ.Хронологическая и подробная иллюстрация основы для методов MFFS MPMR, SGFS, RMFFS и SLSDR показана на рисунке 1.

    Рисунок 1:

    Хронологическая и подробная иллюстрация базовой структуры для методов MFFS MPMR, SGFS, RMFFS и SLSDR .

    Организация последующих секций следующая. Раздел 2 содержит описание таксономии и различных идей, использованных в этом исследовании. В разделе 3 представлено подробное описание механизмов MFFS, MPMR, SGFS, RMFFS и SLSDR, а также изучены преимущества и недостатки каждого из этих методов.В разделах 4 и 5 проводится несколько экспериментов с набором эталонных наборов данных об экспрессии генов и набором клинических данных COVID-19. Кроме того, проводится комплексный анализ полученных результатов. Наконец, Раздел 6 завершает статью.

    2 Таксономия

    В этом разделе представлена ​​экспликация таксономии нашей работы и описаны перспективы методов выбора признаков.

    2.1 Уменьшение размерности

    Массивные наборы данных, состоящие из объектов высокой размерности и включающие относительно небольшое количество паттернов, создают серьезные проблемы для методов машинного обучения [19].Уменьшение размерности является важной проблемой в приложениях машинного обучения в многомерных наборах данных. В частности, когда в исходном наборе признаков имеется ряд избыточных или нерелевантных признаков [20], уменьшение размерности многомерных данных часто необходимо по двум основным причинам. Во-первых, это помогает снизить вычислительную сложность и использование памяти. Во-вторых, многомерные наборы данных имеют некоторые избыточные и зашумленные функции, которые могут негативно повлиять на производительность моделей машинного обучения.Следовательно, выбор подмножества соответствующих функций может снизить вычислительные затраты и привести к моделям, которые лучше обобщают.

    Были введены две основные категории методов уменьшения размерности [21, 22]: выбор признаков и извлечение признаков. Первый включает в себя методы, которые выбирают подмножество соответствующих функций, представляющих исходные данные, тогда как второй ориентирован на преобразование или проекцию исходных данных, которые аппроксимируют все функции. Извлечение функций включает исходные функции для создания новых функций с меньшим размером, которые содержат всю или, по крайней мере, основную часть информации, включенной в первоначальные функции.Выбор функций направлен на выбор подмножества исходных функций путем удаления нерелевантных и избыточных функций. В результате, в то время как методы выбора признаков требуют сбора только выбранных признаков, для извлечения признаков требуются все признаки для уменьшения размерности.

    Методы выбора признаков могут быть контролируемыми, неконтролируемыми и полуконтролируемыми, в зависимости от того, содержит ли набор данных информацию о метках или нет [21, 22, 23, 24]. Методы контролируемого обучения выбирают соответствующие функции, оценивая корреляцию между функциями и их соответствующей меткой.Оценка Фишера [25], критерий независимости Гильберта Шмидта (HSIC) [21], критерий отношения следов и взаимная информация [26] являются одними из наиболее распространенных методов выбора контролируемых признаков. Дискриминационная информация, заложенная в данных этикетки, облегчает выделение дискриминантных признаков из исходных. Когда набор данных частично помечен, для обработки выбора объектов используются полууправляемые методы. Эти методы оценивают релевантность признаков на основе как дискриминационной информации меток, так и информации, встроенной в локальную структуру всего набора данных.Однако бывают ситуации, когда получение достаточного количества размеченных данных затруднено. Для работы с немаркированными наборами данных были разработаны различные методы неконтролируемого выбора признаков, такие как MF [14, 27]. В отличие от двух предыдущих методов, неконтролируемые методы не имеют доступа к отличительной информации, присущей размеченным данным. В этом случае выбор признаков из неразмеченных данных является сложной задачей. Мы представляем различные неконтролируемые методы выбора признаков, применяемые для анализа некоторых немаркированных наборов данных.

    На основе алгоритма поиска для выбора релевантных признаков методы выбора признаков можно разделить на четыре группы: методы фильтра, обертки, встроенные и гибридные методы [21, 28]. Методы фильтрации используют неотъемлемые свойства данных для оценки важности признаков и оценки уместности признаков без использования какого-либо алгоритма машинного обучения. Для этой цели методы фильтрации используют некоторые показатели ранжирования, такие как оценка Лапласа, сходство признаков и коэффициент трассировки. С другой стороны, методы-оболочки применяют определенные алгоритмы обучения, такие как классификация или кластеризация, для выбора наиболее подходящего подмножества функций, что приводит к повышению производительности используемого алгоритма обучения.В этом типе выбора признаков используется метод поиска, чтобы найти наилучшее подмножество признаков. На каждой итерации этот метод создает несколько подмножеств признаков-кандидатов и оценивает полезность каждого сгенерированного подмножества с использованием классификации или алгоритма кластеризации. Подмножество, оцененное как наиболее эффективное, рассматривается как окончательный набор признаков [23, 29]. Преимущества методов фильтрации по сравнению с методами-оболочками заключаются в большей масштабируемости и меньших вычислительных затратах [30, 31, 32].Встроенные методы выполняют выбор признаков в процессе построения модели. Поскольку встроенные методы часто учитывают различные характеристики данных, такие как структура локального многообразия, они обеспечивают лучшую производительность при выборе признаков по сравнению с методами фильтрации и обертки [33]. Гибридные модели строятся путем включения методов на основе фильтров в методы на основе оболочек с целью использования преимуществ обеих моделей [34, 35].

    2.2 Матричная факторизация

    Матричная факторизация (МФ) — это хорошо известная математическая схема, которая недавно была применена к ряду сложных задач числовой линейной алгебры, машинного обучения и вычислительной биологии.Некоторые известные примеры включают собственное разложение матрицы [36], сжатие данных [37], рекомендательные системы [38], спектральную кластеризацию [24] и анализ экспрессии генов [39]. Некоторыми широко используемыми методами на основе MF являются разложение по сингулярным значениям (SVD) [40], анализ основных компонентов (PCA) [41] и вероятностная матричная факторизация (PMF) [42]. В центре внимания последних направлений исследований ML находится использование тех методов MF, которые особенно способны находить закономерности, подходящие для интерпретации данных, используя некоторые важные свойства данных.В частности, неотрицательная матричная факторизация (NMF) [27] используется для анализа матриц данных с неотрицательными элементами. Эти матрицы и их разложение распространены в контексте анализа наборов данных изображений и текста.

    Пусть X ∈ ℝ n × d будет неотрицательной матрицей данных. Техника NMF ищет основанное на частях представление X с точки зрения двух неотрицательных матриц низкого ранга. Общая формулировка NMF может быть выражена как x PQ , в котором две неотрицательные матричные факторы P ∈ ℝ N × K и Q ∈ ℝ K × d , называемые соответственно базисом и матрицей коэффициентов, представляют X .Кроме того, недавно было доказано, что с теоретической точки зрения NMF тесно связан с алгоритмом кластеризации k-средних. По этой причине NMF считается одним из лучших методов обучения без учителя при выявлении скрытого подпространства данных и особенно подходит для кластеризации данных [43]. За последние десятилетия многие методы были основаны на механизме NMF, включая обычный NMF [27], выпуклый NMF (CNMF) [44], ортогональный NMF (ONMF) [45] и полу-NMF (SNMF). [44].Соответственно, ограничение неотрицательности, накладываемое на данные и базисную матрицу в НМФ, ослабляется в рамках СНМФ, элементы базиса в НМФ предполагаются имеющими представление в виде выпуклой комбинации векторов входных данных, и матрицы факторов в ONMF ограничены условием ортогональности, чтобы гарантировать интерпретацию кластеризации.

    Следует отметить, что методы на основе NMF достигают высокой и экономичной эффективности, что является ведущим фактором широкого использования этих методов во многих областях исследований, и особенно в вычислительной биологии [46, 47, 48].Большое количество исследований в области физиологии и нейропсихологии представило доказательства того, что представление неотрицательной матрицы, соответствующей набору данных, с помощью факторов, основанных на частях, должно быть правильным подходом к анализу системы распознавания человеческого мозга [43]. Методы на основе NMF могут быть использованы для математических моделей заболеваний для поиска и тонкой настройки параметров моделей с использованием экспериментальных или клинических данных [49].

    2.3 Изучение подпространства

    Изучение подпространства — это еще один способ уменьшения размерности, который предполагает, что входные данные лежат в некотором внутреннем пространстве более низкого измерения, в которое отображаются исходные объекты.В частности, обучение подпространству можно рассматривать как мощный инструмент для представления пространства более высокого измерения подпространством более низкого измерения с использованием метода обучения. Анализ главных компонент (PCA) [41, 50], линейный дискриминантный анализ (LDA) [51, 52], проекция с сохранением локальности (LPP) [53] и встраивание с сохранением соседства (NPE) [54] являются одними из наиболее распространенных подпространств. методы обучения. Все эти методы можно рассматривать как вариант многообразного обучения, который линейно проецирует входные данные в подпространство, встроенное в окружающее пространство.Линейное отображение этих методов делает их более быстрыми, чем нелинейные варианты многообразного обучения, такие как локально-линейное встраивание (LLE) [55]. В отличие от PCA, который сохраняет глобальную евклидову структуру входных данных, структура соседства каждой точки данных сохраняется в NPE. Эта особенность NPE аналогична LPP, хотя их целевые функции отличаются друг от друга.

    Методы сокращения, описанные в этом разделе, не подходят для решения задач выбора признаков, поскольку их механизмы разработаны только для решения проблем извлечения признаков.Кажется вероятным, что представление, обеспечиваемое функциями в подпространстве более низкого измерения, будет плохо интерпретируемым. Чтобы преодолеть это ограничение, MF, NMF и другие концепции обучения подпространства были объединены для разработки широкой категории новых и эффективных методов выбора признаков. Некоторые важные методы, представленные недавно в этой категории, включают SL-IGO [56], MFFS [14], MPMR [16], NSSLFS [57], SGFS [17], GLOPSL [58], LSS-FS [59], RMFFS. 15], SFS-BMF [60], RNE [61], SLSDR [18] и SLASR [62].

    2.4 Обучение многообразию

    Обучение многообразию раскрывает низкоразмерные многообразия (поверхности ограничений), которые встроены в многомерное пространство входных данных без учителя. Таким образом, многообразный метод обучения приводит к нелинейному уменьшению размерности входных данных с высокой размерностью, таких как медицинские изображения или высокоспектральные данные дистанционного зондирования. Результирующее низкоразмерное вложение лучше всего сохраняет многообразную структуру исходных данных. Для проверки этого условия обычно используются некоторые статистические меры, такие как дисперсия или ошибка реконструкции.В зависимости от типа используемой статистической меры были разработаны различные разнообразные методы обучения. Некоторые ранние примеры включают изометрическое картирование признаков (Isomap) [63], локально-линейное встраивание (LLE) [55], лапласовские собственные карты [64], лапласианскую оценку [65] и выбор нескольких кластеров признаков (MCFS) [66]. Эти методы учитывают многообразную структуру данных посредством их явной формулировки и/или некоторой регуляризации. Все эти методы учитывают только многообразную структуру образцов.

    В последнее время также используются подходы к обучению с использованием двойного многообразия. Суть подходов к обучению с двойным многообразием заключается в использовании двойственной связи образцов и признаков для использования многообразных структур как образцов, так и признаков исходных данных. Идея, лежащая в основе подходов многообразного обучения и двойного многообразия обучения, заключается во включении образцов и/или геометрической структуры признаков в сокращенные данные, полученные в результате использования метода выбора признаков. Для выборок и/или признаков строится граф сходства, который моделирует их локальные геометрические свойства в процессе выбора признаков.В последнее время многие новые и эффективные методы выбора признаков были основаны на многообразном обучении и обучении с двойным многообразием, включая SGFS [17], GLOPSL [58], RGNMF [67], DSNMF [68], DSRMR [69], DGRCFR [70]. , DGSPSFS [71], DMvNMF [72], LRLMR [73], SLSDR [18], MRC-DNN [74], RML-RBF-DM [75] и EGCFS [76].

    2.5 Корреляционный анализ

    В качестве статистического инструмента корреляционный анализ исследует две переменные для определения возможных взаимосвязей между ними. Эти переменные могут быть как зависимыми, так и независимыми.Также возможно, что только одна переменная зависима, а другая независима [77]. Этот анализ оценивает связь переменных с использованием критерия, называемого коэффициентом корреляции. Положительное или отрицательное значение этого критерия указывает на то, что между двумя соответствующими переменными существует положительная или отрицательная корреляция соответственно. При этом большее или меньшее значение коэффициента корреляции показывает, что между соответствующими переменными существует соответственно более сильная или слабая корреляция [78, 79].

    Информация, которую показывает корреляция набора признаков, сыграла ключевую роль в рамках недавно разработанных методов выбора признаков. Показано, что эта проблема отражает новые аспекты исходных данных, что повышает эффективность обучения [21, 22]. Подходы к выбору функций на основе корреляции направлены на изучение уровня корреляции между функциями, чтобы решить, какие функции связаны и должны быть исключены. Процесс обучения направлен на минимизацию корреляции между исходными данными.Корреляция, соответствующая набору признаков, может не только определять релевантные признаки, но и обнаруживать избыточность признаков [80]. В процессе выбора контролируемых методов исследуется связь, которую каждый входной признак может иметь с целевой переменной. Для этого применяются некоторые инструменты статистики, включая взаимную информацию [26], коэффициент корреляции Пирсона [79] и показатель Фишера [25]. Используя эти понятия, выбор входных признаков осуществляется таким образом, чтобы были выбраны наиболее коррелирующие признаки с целью.Что касается неконтролируемых методов, процесс выбора может быть основан на двух основных схемах, которые нацелены на вычисление избыточности функций для определенного подмножества. Первая структура применяет некоторые инструменты, разработанные в теории информации или статистике, для расчета уровня попарной корреляции, сходства и зависимости признаков. Некоторые известные методы, соответствующие этой схеме, можно найти в [81, 82, 83, 84, 85, 86, 87]. Другая структура использует понятие, которое может идентифицировать избыточность функций для расчета соединений функций.Целевая функция формируется для оценки признаков в совокупности. Задача оптимизации регуляризована с учетом ограничения разреженности. Ряд важных методов, подпадающих под эту категорию, можно найти в [15, 16, 18, 87, 88, 89, 90, 91]. В таблице 1 приведены различные категории, изученные в этом разделе.

    Таблица 1:

    Краткое изложение таксономии и ссылок, относящихся к методам выбора признаков, рассмотренным в этой статье.

    3 Предыстория и методы

    В этом разделе описаны пять методов выбора признаков, основанных на наборе различных концепций, включая метод матричной факторизации, избыточность признаков, корреляцию признаков, множество данных и множество признаков.Эти методы сравниваются и описываются теоретические взгляды на их применение.

    3.1 Обозначения

    Матрица данных X описывается как X = [ x 1 ; x 2 ; … ; x N ] = [ F 1 , F 2 , …, F D ] ∈ ℝ N × D , в котором n и d обозначают количество выборок и количество признаков соответственно.Обозначение I k указывает на единичную матрицу размера k , а 1 k обозначает квадратную матрицу размера k , все элементы которой равны единице. Для любой матрицы Z ∈ ℝ m × n транспонирование Z обозначается Tr( Z ). При этом норма Фробениуса и L 2,1 -норма Z определяются как , и , соответственно.Евклидово скалярное произведение двух матриц S, Z ∈ ℝ m × n также представлено как .

    3.2 MFFS

    Два хорошо известных метода, MF и NMF, доказали свою способность эффективно и продуктивно решать задачи кластеризации и крупномасштабной обработки данных. Механизм NMF, основанный на структуре MF, заключается в разложении неотрицательной матрицы на две неотрицательные матрицы. В частности, условие неотрицательности эффективно ограничивает MF, так что только часть представления данных применяется для обработки процесса обучения.В последнее время многие инновационные модификации, основанные на MF и NMF, были включены в структуру выбора признаков. Ван и др. предложил «Выбор признаков на основе матричной факторизации» (MFFS) в качестве нового метода выбора, применяя матричную факторизацию к мере расстояния подпространства [14]. Техника MFFS помогает решить задачу минимизации следующим образом:

    Механизм выбора признаков в MFFS фактически представляет собой процесс MF, в котором соответствующая структура оптимизации ограничивается условием ортогональности.Поскольку решение задачи (1) является сложной задачей, член W T W = I k ограничивается включением штрафного члена в задачу, представленную уравнением. (1). Поэтому задача (1) видоизменяется следующим образом: где ρ обозначает уравновешивающий коэффициент для штрафного срока. Основная трудность при решении проблемы 2 заключается в том, что, хотя целевая функция, заданная в уравнении. (2) по отдельности удовлетворяет условию выпуклости по отношению к W или H , когда H или W фиксируются соответственно, оно не удовлетворяет этому условию одновременно для W и H .Для решения задачи (2) в используемую оптимизационную структуру включен метод множителей Лагранжа. В частности, все переменные считаются постоянными, кроме одной, которая оптимизируется. Процесс оптимизации основан на итеративном алгоритме, для которого существует критерий сходимости, определяющий, когда алгоритм должен остановиться. Алгоритм 1 обобщает структуру MFFS.

    Алгоритм 1

    Метод MFFS.

    3.3 MPMR

    Основной традиционной функцией выбора признаков является удаление тех признаков, которые не имеют отношения к данному набору данных.Однако управление процессами добычи с помощью методов выбора признаков представляет собой сложную проблему, когда данные имеют большую размерность. Такие наборы данных могут быть зашумленными и включать большое количество избыточных или нерелевантных функций. Чтобы преодолеть эту проблему в производительности майнинга, стратегии минимизации избыточности данных могут быть включены в выбор признаков для случая высокой размерности. Ван и др. [16] представил «выбор признаков на основе максимальной проекции и минимальной избыточности» (MPMR) в качестве нового и эффективного метода выбора, основанного на оценке избыточности признаков.Этот метод определяет, насколько данная функция относится к подмножеству функций. MPMR изменяет целевую функцию MFFS, представленную уравнением. (1) в разделе 3.2 разработать структуру выбора функций, основанную на минимизации избыточности между выбранными функциями. Проблема оптимизации MPMR: где α обеспечивает соответствующий баланс между степенями приближения и избыточности, k — количество выбранных признаков, а коэффициент избыточности для выбранных признаков представлен термином Tr( W T X T XW1 k ), в котором 1 k обозначает одну квадратную матрицу размера 90,0 , где k 9019 обозначает одну квадратную матрицу.Интересным моментом является то, что задача 3 свободна от ограничения H ≥ 0, наложенного на задачу 2. Целевая функция, заданная в уравнении. (3) обрабатывается итеративно в два этапа. Во-первых, H считается постоянным, а W обновляется для оптимизации. Затем оптимальные W применяются для оптимизации H . В алгоритме 2 представлена ​​структура для минимизации целевой функции MPMR.

    3.4 SGFS

    Важным свойством, общим для многих наборов данных большой размерности, является локальная структура.Показано, что локальная геометрия таких данных оказывает глубокое и конструктивное влияние на повышение эффективности методов обучения. Для работы с многомерными данными необходимо уменьшить размерность при сохранении локальной структуры. С этой целью данные высокой размерности отображаются в подпространство более низкой размерности исходного пространства данных, так что спроецированные данные по-прежнему содержат локальные свойства исходных данных. Большинство методов выбора признаков используют задачу сохранения геометрии по графу Лапласа.Например, метод «Выбор регуляризованных признаков графа на основе обучения в подпространстве» (SGFS), недавно предложенный Shang et al. [17] применяет концепцию многообразия признаков к структуре MFFS, обсуждаемой в разделе 3.2. Примечательно, что, представляя многообразие признаков графом признаков, SGFS эффективно решает проблему отсутствия локальной геометрической структуры в рамках MFFS и MPMR.

    Алгоритм 2

    Метод MPMR.

    График объекта

    Предположим, что G F — это график объекта, набор вершин, чьи вершины соответствует оригинальным функциям { F 1 , F 2 , …, F д }.Более того, пусть для 1 ≤ i, j d значения сходства признаков, обозначенные , вычисляются как: где σ , известный как параметр Гаусса, является параметром, контролирующим размер окрестности, а 𝒩 k ( f i ) представляет собой набор, называемый k 6 906 -ближайшим соседом и . Каждый из них рассматривается как вес ребра G F и показывает, насколько похожи два элемента f i и f j 900.В частности, чем он больше, тем более похожими будут признаки f i и f j . На следующем этапе для многообразия признаков строится матрица Лапласа графа L F с использованием матрицы подобия . Лаплаксианская матрица определяется как L F = D D F A F F F F , в котором D F — это диагональная матрица, диагональные записи которых для 1 ≤ i d .

    Следует отметить, что матрица H , данная в формуле. (1) предоставляет практический критерий для оценки сходства признаков, так что высокий уровень сходства между признаками f i и f j подразумевает большее сходство между столбцами h i и h j , которые представляют f i и f j 9 соответственно.Включение графа признаков в структуру выбора признаков, использующего упомянутый факт для управления процессом построения H , можно сформулировать следующим образом:

    Задача оптимизации для SGFS получается путем введения члена графа признаков, представленного в уравнении. (5) к задаче (1) как: где неотрицательные параметры α и β обеспечивают компромисс между членами, а разреженность матрицы W обеспечивается введением L 2,1 -нормы в качестве ограничения на W .Чтобы справиться с этим ограничением в расчетах, можно применить формулу ‖ W 2,1 = Tr( W T PW ), в которой диагональная матрица P члены его диагональных элементов , где 1 ≤ i d . На основе алгоритма 3 задача (6) решается отдельно для каждой переменной, считая остальные переменные фиксированными.

    Алгоритм 3

    Метод SGFS.

    3.5 RMFFS

    Как обсуждалось ранее, структуры выбора признаков для MFFS, MPMR и SGFS были разработаны на основе наложения ограничения ортогональности на матрицу весов признаков W . На практике это ограничение почти не выполняется, поскольку ортогональность обычно слишком строгая. Кроме того, существует больше недостатков, касающихся структуры упомянутых методов. Основным недостатком MFFS и SGFS является то, что корреляции между функциями не учитываются в рамках MFFS и SGFS, и эта проблема может негативно повлиять на процесс выбора отличительных признаков.Другим недостатком SGFS является игнорирование избыточности, вызванной нормой L 2,1 , которая ограничивает матрицу весов признаков, чтобы упорядочить ее, чтобы выбор признаков выполнялся более эффективным способом. Несколько информативных признаков, которые являются избыточными, могут быть проигнорированы SGFS, поскольку измерение избыточности игнорируется нормой L 2,1 .

    Эти проблемы решаются в рамках «Неконтролируемого выбора признаков с помощью регуляризованной матричной факторизации» (RMFFS) [15].Этот метод использует структуру неотрицательной матричной факторизации, используемую MFFS, MPMR и SGFS, чтобы предложить новый метод выбора признаков, в котором член регуляризации внутреннего произведения, связанный с матрицей весов признаков, применяется в целевой функции RMFFS. Основной вклад RMFFS заключается в том, что в то же время гарантируется разреженность матрицы весов признаков и низкая избыточность среди выбранных признаков. Задача оптимизации для RMFFS строится как: в котором α является компромиссным параметром.Путем простого расчета задача (7) выражается как: что проще вычислить. В уравнении (8), 1 d представляет собой квадратную матрицу размера d с единицей в качестве ее элементов повсюду.

    Задача (8) может быть решена путем обновления одной переменной до тех пор, пока не произойдет сходимость, а остальные переменные считаются фиксированными. сходимость повторяется. Алгоритм 4 обобщает структуру RMMFS.

    3.6 SLSDR

    Геометрическая информация, локально встроенная как в данные, так и в многообразия признаков, может играть важную роль в повышении эффективности уменьшения размерности [99, 100].Несмотря на этот факт, существует всего несколько методов, которые применяют как геометрию признаков, так и геометрию данных при выборе признаков. Разреженный и малоизбыточный подпространственный регуляризованный надежный выбор признаков на основе обучения с двумя графами, «SLSDR» [18], был предложен путем расширения методов MFFS и SGFS [14, 17], так что данные и многообразия признаков, представленные в терминах регуляризации двойного графа, были включены в формулировку SLSDR одновременно. Таким образом, SLSDR выбирает те функции, которые лучше всего представляют геометрические аспекты всех данных.

    Алгоритм 4

    Метод RMFFS.

    Очевидно, что в SLSDR графики выборок и признаков построены для определения геометрии выборок и признаков соответственно. В SLSDR используется та же стратегия построения графа признаков, что и для SGFS, описанная в подразделе 3.4. Стратегия построения графа данных, используемая SLSDR, подробно описана ниже.

    График данных

    Подобно структуре выбора признаков MFFS, матрица выбора признаков W ∈ ℝ d × k используется в SLSDR для включения локальной геометрической информации данных в алгоритм подбора.Чтобы быть более конкретным, предположим, что граф k -ближайшего соседа, применяемый для эффективного создания множества данных, представлен как набор вершин, идентифицированный как { x 1 , x x 2 , …, x N } Так что каждая вершина графика соответствует образе x I , для 1 ≤ I N . Точно так же, как был построен граф признаков, можно ввести веса сходства данных.В частности, для 1 ≤ i, j n эти веса связаны с каждым ребром, которое связывает две вершины x i и x j сходство вычислений между x i и x j как: Где Σ обозначает гауссовый параметр, который определяет длину окрестности, и 𝒩 K ( x I I ) представляет собой K — набор соседа x I .Следует отметить, что х ij используется для вычисления подобия между x i и x 80 80 80 80 80 80 80 Другими словами, более высокое значение х ij означает большее сходство между x i и x j 0 . Затем для многообразия данных вычисляется матрица Лапласа , в которой диагональ с диагональными элементами, и Ã = [ Ã ij ].

    в качестве многообразия данных предположение [18] состояния, для двух образцов x 1 I и x J , чье сходство высокое, линейные сопоставления x I

    0 W и х j W соответствуют х i и х j 9 0 сходство, сила j График данных с точки зрения матрицы W формулируется следующим образом:

    Кроме того, мотивируя преимуществами, которые метод регуляризации предоставил для RMFFS, термин для регуляризации матрицы выбора добавлен в модель выбора признаков SLSDR в форме внутреннего продукта.Этот новый термин предназначен для определения наиболее репрезентативных признаков с низкой избыточностью, и, как следствие, как разреженность строк, так и корреляции между признаками, вероятно, будут включены в процесс отбора. Таким образом, целевая функция SLSDR определяется следующим образом: где α и β — два параметра баланса, 1 d указывает на квадратную матрицу размерности d с единицей в качестве элементов везде, а L 2,201 2,201 используется, чтобы гарантировать интенсивность остаточной матрицы обучения подпространства против выбросов.Кроме того, L F обозначает матрицу Лапласа, связанную с многообразием признаков, описанных в подразделе 3.4, с помощью графа признаков.

    Задача (11) обрабатывается с использованием структуры, представленной алгоритмом 5. Как обсуждалось в предыдущих подразделах, процесс оптимизации основывается на обновлении только одной переменной, в то время как другие переменные фиксируются до тех пор, пока не будет удовлетворен критерий сходимости.

    4 Экспериментальные результаты

    В этом разделе мы представляем экспериментальные результаты для оценки эффективности и действенности пяти различных алгоритмов выбора признаков, включая MFFS, MPMR, SGFS, RMFFS и SLSDR.Эти алгоритмы были применены к десяти общедоступным наборам данных об экспрессии генов, которые приведены в таблице 2. Некоторые из этих результатов взяты из нашей предыдущей работы [13].

    Таблица 2:

    Подробная информация о десяти наборах данных экспрессии генов, использованных в экспериментах.

    Алгоритм 5

    Метод SLSDR.

    4.1 Описание наборов данных

    Ниже кратко описаны наборы данных, которые мы использовали в наших экспериментах. Следует также отметить, что эти наборы данных доступны в репозиториях [101, 102, 103].

    1. Эмбриональные опухоли ЦНС (ЦНС) Набор данных [104] содержит 60 записей для прогнозирования результатов пациентов с эмбриональной опухолью центральной нервной системы и включает 7129 экспрессий генов в качестве признаков для каждого пациента. 21 запись соответствует выжившим, а остальные — случаям заболеваемости.

    2. Рак толстой кишки Набор данных экспрессии генов [105] включает 62 биоптата, взятых у пациентов с раком толстой кишки. Каждая запись в наборе данных, который содержит 2000 экспрессий генов в качестве признаков, помечена как «отрицательная» или «положительная».Первый соответствует биопсии, взятой из опухоли, а второй указывает на нормальную биопсию, взятую из нормальной опухолевой ткани.

    3. Диффузная крупноклеточная В-клеточная лимфома (DLBCL) [106] представляет собой набор данных по экспрессии генов, включающий 4026 экспрессий генов в качестве признаков для различных типов DLBCL. Набор данных состоит из 47 образцов, из которых 24 относятся к группе «В-подобных зародышевых центров», а остальные относятся к группе «активированных В-подобных».

    4. GLIOMA [107] представляет собой набор данных из четырех меток классов и 50 образцов с 4433 экспрессиями генов в качестве признаков.Четыре метки класса: раковые глиобластомы (CG), нераковые глиобластомы (NG), раковые олигодендроглиомы (CO) и нераковые олигодендроглиомы (NO). Количество образцов, соответствующих этим меткам классов, равно 14, 14, 7 и 15 соответственно. Таким образом, этот набор данных относительно сбалансирован по количеству точек данных для каждого класса. Набор данных

    5. Leukemia [108] собран из 72 образцов костного мозга 47 пациентов с острым лимфобластным лейкозом (ОЛЛ) и 25 пациентов с острым миелоидным лейкозом (ОМЛ).Это бинарный набор данных, в котором каждый образец имеет 7070 выражений генов в качестве признаков.

    6. Рак легкого [109] также представляет собой экспрессию генов, многоклассовый набор данных из 203 образцов, 3312 экспрессий генов в качестве признаков и пять различных меток классов. Метки классов: аденокарциномы, плоскоклеточные карциномы легких, легочные карциноиды, мелкоклеточные карциномы легких и нормальное легкое с 139, 21, 20, 6, 17 образцами соответственно.

    7. Лимфома [110] представляет собой мультиклассовый набор данных, содержащий 96 образцов с 4026 экспрессиями генов в качестве признаков.Профили экспрессии генов соответствуют трем наиболее распространенным лимфоидным злокачественным новообразованиям взрослых: диффузной крупноклеточной В-клеточной лимфоме (DL-BCL), фолликулярной лимфоме (FL) и В-клеточному хроническому лимфоцитарному лейкозу (B-CLL). Набор данных

    8. Prostate Tumor [111] собран из 52 образцов опухолей и 50 нормальных образцов (т.е. всего 102 образца), где каждый образец имеет 10509 экспрессий генов в качестве признаков.

    9. Небольшие круглые синеклеточные опухоли (SRBCT) Набор данных [112] представляет собой мультикатегорийный набор данных об экспрессии генов, состоящий из 83 образцов, 2308 экспрессий генов в качестве признаков и четырех меток классов.8) Набор данных о раке предстательной железы собран из 52 образцов опухолей и 50 нормальных образцов (т.е. всего 102 образца), где каждый образец имеет 10509 экспрессий генов в качестве признаков.

    10. TOX-171 [21] представляет собой набор данных экспрессии генов с 5748 экспрессиями генов в качестве признаков у 171 пациента с различными кожными заболеваниями. В наборе данных есть четыре категории пациентов: пациенты с лучевой терапией (RadS), пациенты с контролируемой лучевой терапией (RadC), пациенты с раком кожи (SkCa) и пациенты без рака (NoCa).

    4.2 Экспериментальная установка

    Для проведения наших экспериментов мы создали конвейер, состоящий из двух компонентов: выбор признаков и кластеризация. Каждый набор данных был пропущен через первый компонент для выбора подмножества исходных признаков с использованием алгоритма выбора признаков. Затем мы прогнали набор данных с выбранными признаками через модель кластеризации k-средних в качестве последующей задачи [113], чтобы оценить эффективность алгоритма выбора признаков при разделении выборок.Нам нужно было указать некоторые параметры, чтобы запустить алгоритмы выбора признаков, а также модель k-средних в качестве последующей задачи. Для всех алгоритмов выбора признаков и всех наборов данных мы искали количество выбранных признаков k из набора {10 t | т = 1, …, 10}. Кроме того, мы установили максимальное количество итераций на уровне 30 для моделей выбора признаков. Параметр штрафа ρ для методов MFFS, MPMR, SGFS и SLSDR был найден в {10 t | т = — 3, …, 8}.Кроме того, параметр избыточности для MPMR был установлен равным 1. Параметр регуляризации разреженности для RMFFS и SLSDR был выбран из {10 t | т = 0, …, 8}. Наконец, другие параметры регуляризации для SGFS и SLSDR были настроены с {10 t | т = − 8, …, 8}. Для SGFS и SLSDR метод k-ближайших соседей использовался для построения взвешенной матрицы, в которой размер соседей был установлен из {3, 5, 10}. При этом параметр ширины полосы σ в ядре Гаусса выбирался в диапазоне {10 t | т = 0, …, 6}.

    Поскольку кластеризация k-средних чувствительна к начальным случайным значениям центроидов, мы повторили задачу кластеризации для всех наборов данных экспрессии генов 20 раз. Затем мы рассчитали некоторые статистические данные, как описано ниже, для оценки производительности кластеризации. Мы настроили параметры алгоритмов выбора признаков, чтобы получить наилучшие показатели кластеризации. Следует отметить, что мы устанавливаем количество кластеров в кластеризации k-средних равным количеству меток классов в наборах данных.

    4.3 Оценочные метрики для сравнения

    Мы выбрали точность кластеризации (ACC) и нормализованную взаимную информацию (NMI) в качестве оценочных метрик для модели кластеризации [22]. Эти метрики оценки определены ниже:

    4.4 Результаты и обсуждение

    Мы анализируем производительность алгоритмов выбора признаков в этом разделе на основе производительности моделей кластеризации, применяемых к наборам данных экспрессии генов с выбранным подмножеством признаков.

    Все методы выбора признаков сравниваются друг с другом на рис. 2 и рис. 3 на основе показателей кластеризации ACC и NMI соответственно.Численные значения метрик также представлены в таблицах 3 и 4 соответственно. Базовый уровень на этих рисунках и в таблицах соответствует случаю, когда кластеризация k-средних применялась к наборам данных с их исходными характеристиками.

    Таблица 3:

    Результаты точности кластеризации (ACC±STD%), соответствующие пяти методам выбора признаков, рассчитанным на семи наборах данных. В каждой строке первый и второй лучшие результаты выделены жирным шрифтом и подчеркнуты соответственно. Количество выбранных признаков для наилучших результатов кластеризации показано в скобках.(Большее значение ACC указывает на лучшую производительность кластеризации.)

    Таблица 4:

    Результаты нормализованной взаимной информации (NMI±STD%), соответствующие пяти методам выбора признаков, рассчитанным на семи наборах данных. В каждой строке первый и второй лучшие результаты выделены жирным шрифтом и подчеркнуты соответственно. Количество выбранных признаков для наилучших результатов кластеризации показано в скобках. (Большее значение NMI указывает на лучшую производительность кластеризации.)

    Рисунок 2:

    Средние значения ACC (ось y ) по сравнению с семью наборами данных (ось x ).(Большее значение ACC указывает на лучшую производительность кластеризации.)

    Рисунок 3:

    Средние значения NMI (ось y ) по сравнению с семью наборами данных (ось x ). (Большее значение NMI указывает на лучшую производительность кластеризации.)

    Результаты как ACC, так и NMI на рис. 2 и рис. 3 ясно показывают превосходство алгоритма выбора признаков SLSDR над другими алгоритмами в разделении точек данных на отдельные кластеры для большинства наборов данных. . Однако более внимательное изучение рис. 2 и рис. 3 показывает, что влияние выбранных функций SLSDR на производительность кластеризации различается для разных наборов данных.

    Основываясь на различиях между SLSDR и базовыми ACC, мы можем разделить влияние выбора признаков с помощью SLSDR на качество кластеризации различных наборов данных на три уровня: слабый, промежуточный и сильный уровни. Наборы данных по лейкемии, раку легкого и лимфоме относятся к уровню слабого влияния, поскольку указанная разница в АКК кластеризации этих наборов данных составляет менее 5%. Мы наблюдаем промежуточный положительный эффект SLSDR на качество кластеризации наборов данных рака толстой кишки, GLIOMA и TOX-171.Для этих наборов данных разница между ACC SLDR и базовым уровнем находится в диапазоне 5%-15%. Наконец, сильный уровень представляет собой наборы данных CNS, DLBCL, Prostate Tumor и SRBCT, в которых разница между ACC SLSDR и исходным уровнем превышает 15%. В частности, применение SLSDR к начальному набору функций наборов данных DLBCL и SRBCT приводит к примерно на 30% и 26% более высокому уровню кластеризации ACC по сравнению с базовым набором функций.

    Для набора данных по лейкемии ни SLSDR, ни другие алгоритмы выбора признаков не смогли найти признаки, которые привели бы к более высокой кластеризации ACC по сравнению с базовым уровнем (т.е., кластеризация на основе исходного набора признаков). Напротив, значение NMI, соответствующее SLSDR, почти в четыре раза больше, чем базовое значение для набора данных по лейкемии.

    В отличие от набора данных по лейкемии, ни наборы данных по раку легких, ни наборы данных по лимфоме не выиграли ни от одной из схем выбора признаков с точки зрения производительности кластеризации. Хотя SLSDR привел к лучшим оценкам ACC и NMI по сравнению с другими методами выбора признаков, эти оценки были почти идентичны или близки к соответствующим значениям базового уровня.

    Превосходную производительность SLSDR по сравнению с другими методами выбора признаков при эффективной кластеризации некоторых наборов данных можно объяснить аспектом SLSDR с двойным многообразием. То есть информация, извлеченная из геометрических структур объекта и массивов данных, одновременно позволяет SLSDR получать обширные знания о локальном окружении объектов. Это, в свою очередь, приводит к более эффективному удалению избыточных функций из исходного набора данных с помощью SLSDR.

    Принимая во внимание другие методы выбора признаков, производительность SGFS и RMFFS намного лучше, чем у MFFS и MPMR, в отношении как кластеризации метрик ACC, так и NMI почти во всех случаях.По этой причине можно сделать вывод, что регуляризация внутреннего произведения, используемая в RMFFS, приводит к лучшей производительности в процессе выбора признаков по сравнению с термином избыточности, используемым в MPMR, и ограничением ортогональности, используемым в MMFS и MPMR. Кроме того, использование многообразной регуляризации на основе пространства признаков кажется чрезвычайно полезным для повышения уровня эффективности метода SGFS.

    Несмотря на замечания, сделанные выше относительно SGFS и RMFFS, экспериментальные результаты не подтверждают абсолютного превосходства одного метода над другим.Например, с точки зрения ACC, эти два метода работают почти одинаково в некоторых случаях, таких как ЦНС и лейкемия. Однако в большинстве случаев метод RMFFS превосходит SGFS, что можно объяснить следующим образом. Таким образом, можно сделать вывод, что регуляризация внутреннего произведения в RMFFS по сравнению с регуляризацией многообразия признаков в SGFS может иметь лучший эффект для устранения избыточных признаков в пользу информативных.

    На рисунке 4 мы представили средние баллы кластеризации ACC и NMI по всем наборам данных экспрессии генов для различных методов методов отбора признаков.В среднем все методы выбора признаков выбирают подмножество признаков, что приводит к лучшей производительности кластеризации по сравнению с базовым случаем. Метрики кластеризации немного уменьшаются, когда мы переключаемся с MFFS на MPMR. Затем он снова увеличивается за счет изменения метода выбора признаков с MPMR на SGFS. Тенденция к увеличению производительности кластеризации сохраняется по мере того, как мы переходим к RMFFS, а затем к SLSDR.

    Рисунок 4:

    Средние значения ACC и NMI (ось y ) в сравнении с шестью методами выбора признаков (ось x ).(Большее значение ACC или NMI указывает на то, что соответствующий метод имеет лучшую производительность.)

    4.5 Статистический анализ

    В предыдущем подразделе мы показали, что SLSDR имеет более высокие средние оценки ACC и NMI по сравнению с другими методами выбора признаков. . В этом подразделе мы попытаемся показать, насколько статистически значимы упомянутые различия. Сначала мы рассмотрим непараметрический тест Фридмана, примененный к средним значениям показателей ACC и NMI по всем наборам данных.Этот тест обеспечивает ранжирование всех методов выбора признаков на основе нулевой гипотезы, которая утверждает, что все эти методы приводят к одинаковым результатам без каких-либо существенных различий. Мы использовали процедуру Холма в качестве апостериорного анализа, чтобы проверить различия, наблюдаемые между этими методами.

    Мы продемонстрировали средние рейтинги различных методов выбора признаков на рисунке 5, полученные с помощью теста Фридмана на основе средних оценок ACC и NMI. Методы с более низкими рангами обладают более высокой производительностью.Таким образом, SLSDR и RMFFS имеют, соответственно, первую и вторую лучшую производительность с точки зрения оценок кластеризации ACC и NMI. Рейтинг ACC MPMR немного выше, чем у базового уровня, что указывает на то, что набор данных, набор функций которого выбран MPMR, потенциально будет иметь более низкий показатель кластеризации ACC по сравнению с базовым уровнем. Результаты ACC на рисунке 2 для наборов данных рака толстой кишки, лейкемии, рака легких и опухоли простаты хорошо согласуются с этим выводом.

    Рисунок 5:

    Средние ранги, полученные с помощью теста Фридмана для каждого метода в отношении различных показателей оценки наборов данных.(Чем ниже ранг оценочных показателей, тем выше эффективность методов.)

    Мы также выполнили процедуру Холма для попарного сравнения методов, чтобы сделать вывод о любых статистически значимых различиях между ними с точки зрения показателей кластеризации. Результаты представлены в таблице 5 и таблице 6 для показателей ACC и NMI соответственно. Мы установили SLSDR в качестве метода управления, а уровень значимости α был равен 0,05. Для случаев ACC и NMI, если значение Холма p попарного сравнения меньше или равно 0.025 процедура Холма отвергает нулевую гипотезу. Таблица 5 ясно показывает, что разница между кластеризацией ACC метода SLSDR, с одной стороны, и таковой для Baseline, MPMR, MFFS и SGFS, с другой стороны, является статистически значимой. Аналогичный вывод можно сделать из таблицы 6 на основе показателя NMI. Поскольку значения p Холма для этих четырех методов составляют < = 0,025 как для случаев ACC, так и для случаев NMI. Однако процедура Холма не может отвергнуть нулевую гипотезу для метода RMFFS, поскольку соответствующее значение p Холма больше 0.025. Другими словами, из результатов процедуры Холма можно с уверенностью сделать вывод об отсутствии статистически значимой разницы между методами SLSDR и RMFFS с точки зрения кластеризации ACC или NMI.

    Таблица 5:

    Апостериорные сравнения показателя ACC с использованием уровня значимости α = 0,05. Здесь методом контроля является SLSDR, а процедура Холма отклоняет нулевую гипотезу, когда p -значение Холма попарного сравнения ≤ 0,025.

    Таблица 6:

    Апостериорные сравнения показателя NMI с использованием уровня значимости α = 0.05. Здесь методом контроля является SLSDR, а процедура Холма отклоняет нулевую гипотезу, когда p -значение Холма попарного сравнения ≤ 0,05.

    4.6 Анализ вычислительной сложности

    Превосходная производительность SLSDR при выборе признаков связана с большими вычислительными затратами по сравнению с другими методами. В таблице 7 сравнивается вычислительная сложность для каждой итерации различных алгоритмов выбора признаков в этой работе. Вычислительная сложность SLSDR, θ SLSDR , отличается от других методов двумя способами.Во-первых, θ SLSDR является квадратичной функцией числа выборок ( n ), тогда как вычислительная сложность MFFS, MPMR и RMFFS не зависит от n . Вычислительная сложность SGFS также является функцией n , но это линейная зависимость. Таким образом, в наихудшем сценарии, когда n находится в одном порядке с числом признаков, d , временная сложность SLSDR становится кубической ( O ( n 3 )) в большой, многомерный набор данных.Во-вторых, в отличие от других методов, θ SLSDR также является функцией количества выбранных признаков ( k ). На рисунке 6 показано время выполнения различных методов выбора признаков для разных наборов данных об экспрессии генов в зависимости от k , где значение k выбирается из набора {10, 40, 80, 100}. Из рисунка 6 видно, что SLSDR имеет значительно более длительное время работы, чем другие методы. Кроме того, по мере увеличения количества выбранных функций с 10 до 100 увеличивается и время выполнения.

    Таблица 7:

    Сравнение вычислительной сложности для каждой итерации среди различных методов выбора признаков. Обратите внимание, что n — это количество выборок, d — это количество признаков, а k — это количество выбранных признаков.

    Рисунок 6:

    Время выполнения различных методов выбора признаков для разных наборов данных экспрессии генов в зависимости от k , где значение k ∈ {10, 40, 80, 100}.

    5 Применение к набору клинических данных COVID-19

    В этом разделе мы оцениваем эффективность алгоритмов выбора признаков при классификации, выживают ли пациенты с COVID-19 или нет.Набор клинических данных COVID-19 был собран в Бирджандском университете медицинских наук с марта 2020 года по август 2020 года и включает клинические данные 500 пациентов и 66 клинических маркеров крови. Диагноз COVID-19 у этих пациентов был подтвержден положительным клинико-лабораторным тестом на SARS-CoV-2* методом ПЦР.

    Из-за относительно небольшого количества выборок в наборе клинических данных COVID-19 любая модель машинного обучения, обученная на полном наборе функций, подвержена переобучению.Чтобы решить эту проблему, мы обучили классификатор на подмножестве функций, которые менее коррелируют друг с другом и лучше предсказывают метки классов.

    Поскольку алгоритм Random Forest в целом устойчив к переобучению [114], мы решили использовать его для обучения модели классификации на наборе данных COVID-19. Чтобы контролировать переоснащение и возможность обобщения невидимых данных, мы адаптировали специальную схему обучения, которая включала две вложенные процедуры перекрестной проверки (CV). Внешнее CV использует 10 сгибов, где все данные случайным образом разбиваются на 10 подмножеств (сгибов).Одно подмножество сохраняется для тестирования, а остальные 9 подмножеств объединяются и передаются во внутреннее резюме. Этот процесс повторяется 10 раз, каждый раз для тестирования выбирается отдельное подмножество, пока не будут исчерпаны все 10 кратностей. Мы использовали 5-кратное внутреннее резюме для обучения алгоритмов выбора признаков и настройки гиперпараметров.

    Результатом внутреннего CV является модель выбора признаков с оптимальными гиперпараметрами, которая дает нам наилучшее подмножество признаков, которые можно использовать для эффективного разделения выборок с разными метками классов.В каждой итерации внешнего CV классификатор Random Forest обучается на основе подмножества признаков, выбранных внутренним CV. После последней итерации внешнего CV общий показатель классификации получается путем усреднения показателей производительности каждого из 10 классификаторов случайного леса. Алгоритмы выбора признаков и их гиперпараметры такие же, как упомянутые в подразделе 4.2. Чтобы исследовать влияние количества признаков на производительность классификатора, мы обучили разные классификаторы для разного количества признаков, которые принимали значения в диапазоне 2, 4, 6, 8 и 10.

    Мы использовали пять различных показателей для оценки эффективности классификации модели случайного леса, включая точность классификации (ACC), истинную положительную долю (TPR), истинную отрицательную долю (TNR), положительную прогностическую ценность (PPV) и отрицательную прогностическую ценность ( ЧДД) [115]. Описание этих метрик классификации дано в Дополнительных материалах. Здесь следует упомянуть, что когда бинарный классификатор предсказывает, что метка класса наблюдения будет «Положительной» или «Отрицательной», предсказанная метка может быть «Истинной» или «Ложной» по отношению к фактическому (основному) метка наблюдения.В нашем наборе данных COVID-19 положительные и отрицательные метки соответствуют условиям смерти и выживания соответственно.

    На рис. 7 показаны метрики классификации классификатора Random Forest для разных алгоритмов выбора признаков и разного количества выбранных подмножеств признаков k = {2, 4, 6, 8, 10}. Числовые значения метрик также представлены в Таблице S.1 Дополнительных материалов.

    Рисунок 7: Показатели производительности

    классификатора Random Forest: (a) Classification ACC, (b) TPR, (c) TNR, (d) PPV и (e) NPV.

    На всех графиках на рис. 7 можно легко определить общую тему. Поскольку k увеличивается за пределы 4 и задействовано больше признаков, SLSDR превосходит другие алгоритмы выбора признаков при выборе подмножества признаков, что приводит к лучшим показателям классификации. Мы приписываем такое поведение SLSDR его двойному многообразию, которого нет в других методах. Другими словами, SLDR одновременно использует геометрические структуры объекта и массивы данных, так что эта богатая информация о геометрии набора данных делает SLSDR превосходным по сравнению с другими методами.Действительно, базовая сеть графов SLSDR, которая соединяет функции, и связанная с ней матрица лапласиана графа облегчают поиск наименее избыточных функций, которые могут эффективно представлять исходный набор данных.

    Принимая во внимание четыре других метода (например, MFFS, MPMR, SGFS и RMFFS), трудно утверждать абсолютное превосходство одного метода над другим. Например, с точки зрения классификации ACC на рисунке 7a эти четыре метода дают почти одинаковые результаты классификации.С точки зрения TPR (см. рис. 7b) метод MFFS работает лучше, чем другие, для k = 2 и 8, тогда как метод RMFFS превосходит другие методы для k = 6. С точки зрения TNR (см. рис. 7c ), за исключением k = 8, метод SGFS работает относительно лучше, чем другие методы.

    Стоит проанализировать, как алгоритмы выбора признаков работают с ложноположительными результатами (FP) при прогнозировании выживания COVID-19. Когда классификатор Random Forest обучается только на двух функциях, как показано на рисунке 7c, максимальное значение TNR равно 61.09% достигается при выборе признаков методом SGFS. Однако, когда количество выбранных функций увеличивается, SLSDR превосходит SGFS в повышении TNR, так что он достигает 91,22% при k = 10, что примерно на 4% выше, чем соответствующее значение SGFS. Аналогичным образом, на рисунке 7d показано, что метод SGFS приводит к наивысшему среднему значению 70,11% для PPV при 90 179 k 90 180 = 2, тогда как SLSDR превосходит SGFS при 90 179 k 90 180 ≥ 6 и приводит к классификатору с максимальным средним значением PPV, равным 93.07% при k = 10. Учитывая TNR и PPV, становится ясно, что FP играют важную роль в изменении этих двух показателей. Из этих результатов мы можем сделать вывод, что классификатор, обученный на двух функциях, имеет относительно большое количество FP. В частности, даже лучшее значение PPV 70,11% при k = 2 в нашем анализе означает, что около 30 из 100 пациентов с COVID-19 ошибочно прогнозируют, что они не выживут. Однако количество FP уменьшается по мере увеличения k, так что только 7 из 10 пациентов с COVID-19 могут быть ложно предсказаны, что они не выживут.Это тот случай, когда SLSDR выбирает 10 функций.

    Еще более важно выяснить, как классификатор обрабатывает ложноотрицательные (FN) результаты, поскольку он определяет время отклика и стратегию спасения жизней тех, кто, вероятно, умрет из-за COVID-19. В этом случае нам могут помочь результаты TPR (чувствительности) на рисунке 7b и значения NPV на рисунке 7e. С одной стороны, когда классификатор Random Forest обучается на 2 и 8 функциях, выбранных SLSDR, средние значения TPR составляют 86.79% и 95,13% соответственно. Последнее намного выше по сравнению со значениями, соответствующими другим методам отбора признаков. Даже 2 из 20 признаков из набора данных COVID-19, выбранных SLSDR, позволяют классификатору достичь среднего NPV 77,16%. То есть из 100 пациентов, которые по прогнозам выживут от COVID-19, на самом деле выживут 78 пациентов. Когда SLSDR выбирает 8 признаков, средняя NPV классификатора достигает 93,79%. Это означает, что классификатор имеет тенденцию предсказывать меньше ложных отрицательных результатов, когда он обучен с использованием 8 функций, выбранных SLSDR.При k = 10 средние значения TPR и NPV, соответствующие всем методам отбора признаков, почти идентичны, за исключением SGFS, средние значения TPR и NPV которого примерно на 2% ниже, чем у других методов.

    Эти избранные функции и результаты важны для принятия стратегических и клинических решений в центрах лечения COVID-19. В то время как количество коек в отделениях интенсивной терапии и другие важные ресурсы ограничены, сосредоточение внимания на узких клинических данных (2 или 8) оптимизирует управление медицинской помощью, поскольку пациенты с риском смерти могут быть в приоритете при получении неотложной помощи.Модель, которую мы представили здесь, особенно когда она обучена на 8 функциях, выбранных SLSDR, может вооружить лиц, осуществляющих уход, чтобы надежно исключить необходимость выделения ресурсов пациентам с COVID-19, которые, вероятно, выживут.

    В то время как положительный результат ПЦР-теста на COVID-19 подтверждает инфекцию у пациента, некоторые клинические проявления и характеристики, такие как возраст и рентгенологическая визуализация, могут помочь клиницисту при принятии решения, однако прогнозирование клинического течения заболевания представляет собой сложную задачу.Для поиска таких клинических предикторов использовались данные пациентов с COVID-19 [116, 117, 118, 119].

    На рис. 8 показана частота двух признаков, выбранных пятью алгоритмами выбора признаков на каждой итерации внешнего 10-кратного CV во время обучения классификатора Random Forest. Интересно, что методы RMFFS (см. рис. 8c) и SGFS (см. рис. 8d) имеют наименьшие и наибольшие вариации для разных пар выбранных признаков. Кроме того, за исключением SGFS, другие методы (O 2 Saturation, CRP) выбирали пару признаков чаще, чем другие пары.В крайнем случае RMFFS выбрал пару признаков (O 2 Насыщенность, CRP) во всех 10 итерациях 10-кратного CV. Сообщалось, что гипоксия (низкое насыщение O 2 по ABG) и более высокие аномальные уровни СРБ связаны с плохим прогнозом заболевания COVID-19 и коррелируют с более высокими показателями смертности [120, 121, 122, 123, 124, 125]. Кроме того, частота каждого отдельного признака, представленного на рисунке 8, суммируется по всем пяти методам выбора признаков, и результат демонстрируется на рисунке 9.Помимо CRP (частота = 39) и насыщения O 2 (частота = 34), также были выбраны количество тромбоцитов, креатин и количество лимфоцитов, однако с гораздо более низкими частотами. Эти последние три признака также были зарегистрированы как прогностические маркеры плохого прогноза и смертности у пациентов с COVID-19 [126, 127, 128, 129, 130, 131].

    Рисунок 8:

    Частота пары признаков (биомаркеров), выбранных различными методами отбора признаков на каждой итерации 10-кратного CV классификатора Random Forest.Методы выбора признаков: (a) MFFS, (b) MPMR, (c) RMFSS, (d) SGFS и (e) SLSDR. (ALT: аланинаминотрансфераза, AST: аспартатаминотрансфераза, CRP: C-реактивный белок, K : Калий, Лимфа: Количество лимфоцитов, Na: Натрий, O 2 Sat:O 2 Насыщение по ABG, PLT: количество тромбоцитов, PMH: Анамнез заболевания (рак, диабет, ишемическая болезнь сердца, почечная недостаточность, иммунодефицит) , PTT: частичное тромбопластиновое время, WBC: количество лейкоцитов)

    Рисунок 9:

    Совокупная частота признаков (биомаркеров), выбранных всеми методами отбора признаков вместе на всех итерациях 10-кратного CV классификатора Random Forest, где на каждой итерации выбираются только два признака (k = 2).(ALT: аланинаминотрансфераза, AST: аспартатаминотрансфераза, CRP:C-реактивный белок, K: калий, Lymph: количество лимфоцитов, Na: натрий, O 2 Sat:O 2 Насыщение по ABG, PLT: количество тромбоцитов, PMH: Анамнез заболевания (рак, диабет, ишемическая болезнь сердца, почечная недостаточность, иммунодефицит), PTT: частичное тромбопластиновое время, WBC: количество лейкоцитов)

    6 Заключение

    Сложные заболевания, такие как COVID-19, когда они проявляются пандемии, имеют серьезные последствия для систем здравоохранения.Чтобы преодолеть осложнения COVID-19 для отдельных пациентов и систем здравоохранения, жизненно важно разработать передовые количественные цифровые платформы здравоохранения, чтобы назначить оптимизированное принятие клинических решений каждому пациенту. Чтобы предсказать прогноз COVID-19 при персонализированном подходе, нам необходимо изучить многомерное клиническое и биомаркерное пространство этого заболевания, чтобы выбрать набор клинических и биомаркерных признаков. Размер и содержание этих подписей должны быть эффективными как с точки зрения затрат, так и времени.Хотя в системной биомедицине используются механистические и феноменологические прогностические модели [132, 133, 134, 135], из-за сложности COVID-19 и мультиорганного заболевания нам необходимо использовать методологии машинного обучения, чтобы уменьшить многомерные пространство клинического и биомаркерного пространств [13].

    Использование подходов системной медицины для поиска дифференциально экспрессируемых биомаркеров помогает исследовать различные сигнатуры биомаркеров [136]. Однако основные характеристики могут быть упущены при применении к клиническому и биомаркерному пространству такого заболевания, как COVID-19.Наша методология в этой статье показывает, как мы можем обнаружить клинические прогностические показатели для COVID-19 за счет уменьшения высокой размерности пространства клинических признаков. Будущие клинические когорты и систематические исследования COVID-19 могут использовать наши результаты, чтобы доказать эффективность принятия клинических решений на основе количественного машинного обучения, поскольку это необходимо, чтобы быть готовым к появлению или повторному появлению других инфекционных заболеваний, таких как COVID-19.

    Доступность данных

    Участники этого исследования не давали согласия на то, чтобы их данные были опубликованы, поэтому подтверждающие данные недоступны.

    Вклад авторов

    Ф.С.М., И.Т., Ф.С.М., Д.Х. и А.М. задумал проект. М.М., М.М., Ф.А., Е.Ф., С.В. и это. проанализировали клинические данные. Ф.С.М., И.Т., Ф.С.М., М.Ф. и А.М. разработана вычислительная методика. Ф.С.М., И.Т., Ф.С.М., А.М., М.Р.Р., К.Б., М.Р., С.К., М.Н., Д.Х. и М.Дж. провели вычислительный анализ. IT, MM, MM, EF, FS и MD написали клинический раздел. Все авторы прочитали и прокомментировали рукопись.

    Благодарности

    I.Т. внес свой вклад в эту статью в Программе клеточной энергетики Института теоретической физики Кавли, частично поддержанной грантом Национального научного фонда NSF PHY-1748958, грантом NIH R25GM067110 и грантом Фонда Гордона и Бетти Мур 2919.02. Эта работа была частично поддержана Программой внутренних исследований Национального института неврологических расстройств и инсульта / Национальных институтов здравоохранения (грант NS003031) (для FS).

    Сноски

    • ↵* Обезличенные клинические данные всех пациентов с COVID-19, которые были госпитализированы в клинические центры Бирджандского университета медицинских наук в течение указанного времени, были использованы с разрешения Institutional Review Board (IRB).

    Сокращения

    (ALT)
    аланинаминотрансферазы
    (ABG)
    Артериальная газов крови
    (AI)
    Искусственный интеллект
    (АСТ)
    аспартатаминотрансферазы
    (ЦНС)
    Центральная нервная система
    (ACC)
    классификация / кластеризация Точность
    (CBC)
    COMPLE
    (CNMF)
    (CNMF)
    выпуклый NMF
    (COVID-19)
    Коронавирусная болезнь 2019
    (CV)
    Крест-варитель
    (CRP)
    C-реактивный белок
    (DLBCL)
    диффузные большие B-клеточные лимфома
    (FN)
    (FN)
    false отрицательный
    (false plance)
    (FS)
    Выбор признаков
    (HSIC)
    Критерий независимости Гильберта Шмидта
    (INR)
    Международный нормализованный коэффициент о
    (Isomap)
    Изометрические Mapping Функция
    (LDA)
    Линейный дискриминантный анализ
    (LPP)
    Местность Сохраняя Проекционные
    (ЛПЭ)
    Локально Linear Вложение
    (ML)
    Machine Learning
    (MF)
    Матрица Факторизация
    (MFFS)
    Матрица Факторизация Функции Выбор
    (MPMR)
    (MPMR)
    Максимальная проекция и минимальная резервирование
    (MCFS)
    Multi-Cluster Cluster Выбор
    (NPV)
    прогностическая ценность отрицательного
    (NPE)
    Район Сохраняя Встраивание
    (NMF)
    неотрицательная матрица факторизации
    (NMI)
    нормализованной взаимной информации
    (ONMF)
    ортогональным NMF
    (PMH)
    Анамнез заболевания
    (PTT)
    Частичное тромбопластиновое время
    (ПЦР)
    Polymerase цепная реакция
    (PPV)
    положительная прогнозирующая ценность
    (PCA)
    Анализ основных компонентов
    (PMF)
    (PMF)
    (PMF)
    (PMF)
    (RMFFS)
    (RMFFS)
    Регуляризованная матричная факторизация объекта
    (SNMF)
    Semi NMF
    (SVD)
    Особое значение
    Особое значение
    (SRBCT)
    (SRBCT)
    Маленькие круглые голубые ячеистые опухоли
    SLSDR)
    Разретки и низкокрасное подпространственное обучение на основе двойного графа. )
    Подпространственное обучение график регуляризованы функции Выбор
    (TN)
    (TNR)
    (TNR)
    (TNR)
    (TNR)
    (TNR)
    истинный отрицательный курс
    (TP)
    Истинные положительные
    (TPR)
    Истинная положительная ставка
    (WBC)
    Лейкоциты

    Ссылки

    1. [1].↵
    2. [2].↵
    3. [3].↵
    4. [4].↵
    5. [5].↵
    6. [6].↵
    7. [7].↵
    8. [8].↵
    9. [8].
    10. [9].↵
    11. [10].↵
    12. [11].↵
    13. [12].↵
    14. [13].↵
    15. [14].↵
    16. 95ↆ18 [1 953].
    17. [16].↵
    18. [17].↵
    19. [18].↵
    20. [19].↵
    21. [20].↵
    22. [21].↵
    23. [293].↵
    24. [293].↵ [23].↵
    25. [24].↵
    26. [25].↵

      Питер Э. Харт, Дэвид Г. Сторк и Ричард О. Дуда.Классификация узоров. John Willey & Sons, 2001.

    27. [26]. ↵
    28. [27]. ↵
    29. [28]. ↵
    30. [29]. ↵
    31. [30]. ↵
    32. [32].↵
    33. [33].↵
    34. [34].↵
    35. [35].↵
    36. [36].↵

      Гилберт Странг. Линейная алгебра и обучение на основе данных. Cambridge Press, 2019.

    37. [37].↵

      Чару К. Аггарвал. Линейная алгебра и оптимизация для машинного обучения. Спрингер, 2020.

    38. [38].↵
    39. [39].↵
    40. [40].↵

      Джин Х. Голуб и Кристиан Райнш. Разложение по сингулярным числам и решения методом наименьших квадратов. В линейной алгебре, страницы 134–151. Springer, 1971.

    41. [41].↵

      I.T. Джоллифф. Анализ главных компонентов. Springer, 1986.

    42. [42]. ↵
    43. [43]. ↵
    44. [44]. ↵
    45. [45]. ↵
    46. [46]. ↵
    47. 474608 [46]. [48].↵
    48. [49].↵
    49. [50].↵
    50. [51].↵
    51. [52].↵
    52. [53].↵
    53. [54].↵
    54. [55].↵
    55. [94].
    56. [57].↵
    57. [58].↵
    58. [59].↵
    59. [60].↵
    60. [61].↵
    61. [62].↵
    62. [60].
    63. [64].↵
    64. [65].↵
    65. [66].↵
    66. [67].↵
    67. [68].↵
    68. [69].↵
    69. 8 [703].↵ [71].↵
    70. [72].↵
    71. [73].↵
    72. [74].↵
    73. [75].↵
    74. [76].↵
    75. [77].↵
    76. [78].↵
    77. [79].↵

      Джейкоб Бенести, Цзиндонг Чен, Итенг Хуан и Исраэль Коэн. Коэффициент корреляции Пирсона. В разделе «Подавление шума при обработке речи», страницы 1–4. Springer, 2009.

    78. [80].↵

      Марк Эндрю Холл. Выбор признаков на основе корреляции для машинного обучения. Докторская диссертация, Университет Вайкато Гамильтон, 1999 г.

    79. [81].↵
    80. [82].↵

      Михал Хайндл, Петр Сомол, Димитриос Верверидис и Константин Котропулос.Выбор признаков на основе взаимной корреляции. В Ибероамериканском конгрессе по распознаванию образов, страницы 569–577. Springer, 2006.

    81. [83]. ↵
    82. [84]. ↵
    83. [85]. ↵
    84. [86]. ↵
    85. [87]. ↵
    86. 84608 [87]. [89].↵
    87. [90].↵
    88. [91].↵
    89. [92].
    90. [93].
    91. [94].
    92. [95].
    93. [96].
    94. [97].
    95. [98].
    96. [99].↵
    97. [100].↵
    98. [101].↵
    99. [102].↵
    100. [103].↵
    101. [104].↵
    102. [105].↵
    103. [106].↵
    104. [107].↵ 948].
    105. [109].↵
    106. [110].↵
    107. [111].↵
    108. [112].↵
    109. [113].↵
    110. [114].↵8 [114].
    111. [116]. ↵
    112. [117]. ↵
    113. [118]. ↵
    114. [119]. ↵
    115. [120]. ↵
    116. [121]. [123].↵
    117. [124].↵
    118. [125].↵
    119. [126].↵
    120. [127].↵
    121. [128].↵
    122. [129].↵
    123. [130].↵
    124. [136].↵ 938].

      Иман Тавасоли. Динамика решения клеточной судьбы, опосредованная взаимодействием аутофагии и апоптоза в раковых клетках: математическое моделирование и экспериментальные наблюдения. Springer, 2015.

    125. [133].↵
    126. [134].↵
    127. [135].↵
    128. [136].↵

    Abstract

    Визуализация кальция in vivo с использованием миниатюрных микроскопов, устанавливаемых на голове, позволяет отслеживать активность нервных популяций в течение нескольких недель у свободно ведущих себя животных.Предыдущие исследования были сосредоточены на выводе поведения из популяции нейронов, однако выделить нейронные сигналы, учитывая расфокусированную флуоресценцию в эндоскопических данных, сложно. Существующие конвейеры анализа включают идентификацию областей интереса (ROI), что может привести к потере релевантной информации из-за ложноотрицательных результатов или внесению непреднамеренной систематической ошибки из-за ложноположительных результатов. Кроме того, эти методы часто требуют предварительных знаний для настройки параметров и требуют много времени для реализации. Здесь мы разрабатываем сквозной декодер для прогнозирования поведенческих переменных непосредственно из необработанных микроэндоскопических изображений.Наша структура требует небольшого пользовательского ввода и превосходит существующие декодеры, которым требуется извлечение ROI. Мы показываем, что остатки нейропиля/фона несут дополнительную релевантную для поведения информацию. Анализ видео также показывает оптимальное окно декодирования и динамику между остатками и ячейками. Важно отметить, что карты заметности показывают появление видеодекомпозиции в нашем декодере и определяют отдельные кластеры, представляющие разные поведенческие аспекты. Вместе мы представляем структуру, которая эффективна для декодирования поведения на основе микроэндоскопических изображений и может помочь обнаружить функциональную кластеризацию для различных исследований изображений.

    1 Введение

    Отслеживание активности больших популяций нейронов у бодрствующих и ведущих себя животных имеет решающее значение для понимания нейронных вычислений, лежащих в основе когнитивных функций. Недавние достижения в технологии визуализации кальция in vivo способствовали изучению нейронных цепей, лежащих в основе сенсорного восприятия (Glas et al., 2019; Mittmann et al., 2011; Rothschild et al., 2010; Wang et al., 2020; Yoshida). и Ohki, 2020), двигательный контроль (Ebina et al., 2018; Huber et al., 2012; Klaus et al., 2017), врожденное поведение (Betley et al., 2015; Evans et al., 2018; Jennings et al., 2015) и широкий спектр когнитивных форм поведения, таких как принятие решений (Harvey et al., 2012; Pinto and Dan, 2015; Tanimoto et al., 2017), а также обучение и память (Grewe et al., 2017; Roberts et al., 2017; Yu et al., 2017; Ziv et al., 2013). ). В частности, миниатюрная микроскопия с головным креплением в сочетании с микроэндоскопической линзой позволяет получить глубокое изображение мозга свободно движущихся животных (Cai et al., 2016; Флюсберг и др., 2008 г.; Гош и др., 2011). Хотя двухфотонные миниатюрные микроскопы (Helmchen et al., 2001; Sawinski et al., 2009; Zong et al., 2017) были разработаны для получения оптических срезов, они не получили столь широкого распространения из-за технических ограничений, в том числе более медленного скорость сбора данных, значительные артефакты движения и оптические ограничения волокон при передаче фемтосекундных лазерных импульсов с длиной волны 920 нм. С другой стороны, микроэндоскопическая визуализация с использованием однофотонного источника света страдает от больших фоновых флуктуаций из-за флуоресценции вне фокуса.На пути к достижению цели декодирования сенсорных стимулов или поведенческих переменных из записей, то, как правильно извлекать клеточные сигналы из этих низкоконтрастных изображений, было ключевым шагом в конвейерах анализа для визуализации кальция (Lu et al., 2018; Pnevmatikakis, 2019; Чжоу и др., 2018).

    Типичный конвейер анализа (рис. 1а) включает следующие этапы: Во-первых, регистрация кадров изображения путем исправления артефактов движения. Часто движения мозга в поле зрения (FOV) могут быть нежесткими по всем направлениям и приводить к искажениям кадра.Для исправления этих артефактов движения применяется либо жесткий метод сопоставления с шаблоном (Dubbs et al., 2016; Kaifosh et al., 2014), либо нежесткий метод регистрации (Lu et al., 2018; Pnevmatikakis and Giovannucci, 2017). . Во-вторых, извлечение нейронных сигналов посредством оценки пространственных фильтров и соответствующих им временных трасс. Общие методы можно разделить на три класса: полуавтоматический анализ области интереса (ROI) (Klaus et al., 2017; Pinto and Dan, 2015), анализ основных компонентов/анализ независимых компонентов (PCA/ICA) (Mukamel et al. ., 2009; Reidl et al., 2007) и условной неотрицательной матричной факторизации (CNMFe) (Pnevmatikakis et al., 2016; Zhou et al., 2018). Затем вывод пиков времени из извлеченных следов флуоресценции. Чтобы упростить вывод спайков, следы флуоресценции можно рассматривать как последовательности спайков, свернутые с ядром с асимметричной кинематикой подъема и спада. Для решения этой проблемы деконволюции были предложены различные алгоритмы (Jewell and Witten, 2018; Pnevmatikakis et al., 2016; Vogelstein et al., 2010; Yaksi and Friedrich, 2006; Zhou et al., 2018).

    Рис. 1: Типичные и предлагаемые конвейеры анализа данных однофотонной визуализации.

    ( a ) Типовой конвейер анализа. Данные сначала обрабатываются для удаления артефактов движения путем оценки поля движения из каждого кадра данных в шаблон ( наверх ). Из-за ограниченного осевого разрешения и низкого контраста в микроэндоскопической визуализации нейроны могут казаться пространственно перекрывающимися и часто требуют алгоритма декомпозиции видео, такого как CNMFe (см. Материалы и методы). После удаления фоновых сигналов извлекаются местоположения нейронов в поле зрения (FOV) и их активность ( в середине ).После этого по каждому следу флуоресценции можно сделать вывод о пиковой активности. Наконец, для расшифровки поведения животного использовались либо спайки, либо следы флуоресценции ( внизу ). Различные этапы конвейера отображаются на одном животном в нашем эксперименте. ( b ) Предлагаемый трубопровод. Поведение животных напрямую декодируется из необработанных фильмов после удаления артефактов движения.

    Наконец, расшифровка поведенческих переменных или сенсорных стимулов либо из извлеченных следов флуоресценции, либо из предполагаемых серий спайков.Общие декодеры, включая реконструкцию вектора популяции (Georgopoulos et al., 1986; Salinas and Abbott, 1994), фильтр Винера (Carmena et al., 2003), сопоставление шаблонов (Wilson and McNaughton, 1993; Zhang et al., 1998)), Байесовская парадигма (Браун и др., 1998; Сэнгер, 1996; Ву и др., 2006; Чжан и др., 1998) и модели машинного обучения (например, метод опорных векторов (SVM), k-ближайших соседей (kNN). ), линейный дискриминантный анализ Фишера (LDA), многослойный персептрон (MLP), рекуррентная нейронная сеть (RNN)) применялись в различных исследованиях (Glaser et al., 2020; Перейра и др., 2009 г.; Кирога и Панцери, 2009 г.).

    Здесь мы предлагаем сквозную парадигму декодирования для прямого извлечения информации о поведении из необработанных однофотонных микроэндоскопических данных (рис. 1b) и оценки с использованием задачи прогнозирования кинематики на основе кальциевой визуализации CA1 гиппокампа у свободно кормящихся мышей (рис. 2а, б). Мы предполагаем, что нейропиль/фон, который был отброшен в большинстве конвейеров анализа, может кодировать положение и/или скорость животного. Вместо того, чтобы делать предположения о формате соответствующих сигналов, наша парадигма использует недавний прогресс в области глубокого обучения, чтобы определить, какие компоненты данных изображения являются наиболее информативными без необходимости сложной предварительной обработки.Наш декодер превосходит методы декодирования, использующие извлеченные нейронные сигналы. Результаты сравнивают кодирующую способность между предполагаемыми нейронами и фоновыми остатками и определяют вклад в различные моменты времени. Изучая карты важности, мы обнаруживаем, что декомпозиция видео естественным образом возникает в нашем декодере. Наши результаты предполагают, что нейропиль / фон являются дополнительным кодировщиком информации в микроэндоскопических записях и предоставляют новый способ идентификации нейронных ансамблей, представляющих различные аспекты пространственной навигации.

    Рисунок 2: Точное декодирование положения и скорости бега по необработанным микроэндоскопическим изображениям.

    ( a-d ) Схема подготовки данных и архитектуры модели. Подробности см. в разделе «Материалы и методы». ( a ) Микроэндоскопическая визуализация в CA1, экспрессирующем jGCaMP7f. ( b ) Пример исследовательского эксперимента в Н-образном лабиринте. Каждый лабиринт имеет длину около 1 м. ( c ) Положения животных ( x, y ) были выровнены по данным визуализации, уменьшены до 10 Гц, сглажены, а затем повернуты, чтобы уменьшить их корреляции.Наконец, позиции и скорости ( x, y, v ) были масштабированы до [-1, 1]. ( d ) Архитектура ConvNet. В каждый момент времени изображение передавалось в глубокую сеть, состоящую из двумерных сверточных слоев с активациями дырявого ReLU, за которыми следовали плотные слои с головкой регрессии для декодирования позиции ( x, y ) и мгновенной скоростью ( v ) животное. ( e ) Пример 10-секундных траекторий истинного (серый) и расшифрованного (черный) положений животного в эксперименте по исследованию □-лабиринта.Вверху: 10-секундная траектория движения животного. Внизу: 10-секундная траектория, когда животное было неподвижно или бежало со скоростью менее 5 см/с. ( f ) Декодированные переменные во времени в примере тестового набора. Серая линия обозначает истинные следы. Точки обозначают прогнозируемые трассы, окрашенные в зависимости от скорости бега. Средняя ошибка декодирования x, y и v: 7,84 см, 12,70 см, 6,23 см/с соответственно. ( g ) Производительность модели для всех наборов данных. Слева: наша модель ConvNet имела меньшую медианную ошибку в прогнозировании позиций (10.17 ± 0,43 см), чем базовые декодеры. Все они были выше уровня вероятности (48,57 ± 2,67 см; 90 179 p 90 180 < 1 90 179 e 90 180 - 5). Справа: скорость декодирования в нашей модели ConvNet (3,39 ± 0,14 см/с) была сравнима с декодером, обученным на нейронных сигналах (3,36 ± 0,14 см/с; p = 0,78), и лучше, чем у декодера, обученного на сигналах ROI ( 3,62 ± 0,18 см/с; 90–179 р 90–180 < 0,05). Все показатели были лучше, чем случайный уровень (4,66 ± 0,19 см/с; 90 179 p 90 180 < 1 90 179 e 90 180 - 5). ( h ) Распределение ошибок декодирования положения ( верхнее ) и скорости ( нижнее ) в примере набора данных по тестовым сгибам.Все значения p были получены с помощью знакового рангового критерия Уилкоксона.

    2 Предыдущая работа

    В типичном конвейере анализа то, как извлекаются и структурируются нейронные сигналы, является ключевым фактором, определяющим однофотонные микроэндоскопические данные. К сожалению, существующие методы извлечения исходного кода имеют несколько ограничений. Возьмем, к примеру, полуручной анализ ROI (Klaus et al., 2017; Pinto and Dan, 2015), загрязнение нейропиля из-за расфокусированной и рассеянной флуоресценции часто неадекватно удаляется и требует явных предположений о структуре нейропиля.Кроме того, сигналы пространственно перекрывающихся нейронов нельзя разделить. Кроме того, ручная аннотация ROI может быть очень изменчивой из-за разногласий между маркировщиками и трудоемкой для крупномасштабных записей, в то время как пороговое значение карты активности, которая указывает изменения значения флуоресценции во времени для каждого пикселя, часто приводит к высокой частоте промахов для Обнаружение ROI. Что касается анализа PCA/ICA (Mukamel et al., 2009; Reidl et al., 2007), он игнорирует тот факт, что нейроны обычно имеют корреляции сигналов и корреляции шума (Averbeck et al., 2006). Более того, это линейный метод, и он не может должным образом разделить сигналы пространственно перекрывающихся нейронов. В последнее время CNMFe (Zhou et al., 2018) приобрел популярность благодаря своей превосходной способности демиксировать и шумоподавлять нейронные сигналы из микроэндоскопических данных. Однако это зависит от сложной настройки гиперпараметров, которая требует предварительных знаний о количестве нейронов и их размерах. Кроме того, он чувствителен к инициализации параметров и имеет неуникальные решения для идентификации ROI.В частности, все эти методы имеют ошибки обнаружения, которые приводят либо к введению дополнительной систематической ошибки, либо к отбрасыванию релевантной информации. Помимо вышеперечисленных проблем, эти алгоритмы часто требуют много времени.

    В недавнем исследовании был разработан новый конвейер извлечения сигналов для однофотонной микроэндоскопической визуализации (MIN1PIPE) (Lu et al., 2018) для улучшения идентификации ROI. Благодаря включению двухкомпонентной гауссовской смешанной модели (GMM) и обученной рекуррентной нейронной сети (RNN) колебания, которые вряд ли могут быть переходными процессами кальция, удаляются, что приводит к очищенному набору начальных значений ROI.Этот метод уменьшает необходимость эвристической установки многих гиперпараметров. Однако это требует больших вычислительных ресурсов и требует дополнительных ручных оценок для обучения классификации переходных процессов кальция. Признавая сложность получения предварительно обработанных данных для декодирования, в другом исследовании была разработана Deepinsight (Frey et al., 2019), структура глубокого обучения, позволяющая делать выводы о поведении на основе широкополосных нейронных данных (например, необработанных записей электрофизиологии без сортировки спайков). Однако, когда дело доходит до данных визуализации кальция, это исследование по-прежнему требует извлечения временных трасс из идентифицированных областей интереса, прежде чем преобразовывать их в частотные представления, которые предоставляются декодеру в качестве входных данных.

    Сквозной декодер широко используется во многих областях машинного обучения, но, насколько нам известно, никогда не применялся в области нейробиологии. Здесь мы стремимся напрямую извлекать поведенческую информацию из необработанных микроэндоскопических записей и изучать ее усвоенные представления.

    3 Результаты

    Чтобы оценить, насколько хорошо поведенческая информация может быть непосредственно извлечена из данных микроэндоскопической визуализации с помощью предложенной нами парадигмы декодирования (рис. 1b), мы экспрессировали индикатор Ca 2+ jGCaMP7f в дорсальном гиппокампе мышей, которым имплантировали линзу GRIN. прямо над областью СА1 (рис. 2а) и зафиксировали активность кальция в СА1 с помощью миниатюрного однофотонного микроскопа, прикрепленного к голове, в то время как животное свободно перемещалось по разным лабиринтам (рис. 2b и дополнительная рис. 1а).Данные визуализации и информация о поведении животного записывались одновременно, синхронизируясь с частотой дискретизации 30 Гц.

    Чтобы сгенерировать необходимые входные данные и метки для модели декодера, мы сначала предварительно обработали поведенческие данные на следующих шагах. И изображения, и положение животных ( x,y ) были уменьшены до 10 Гц, чтобы уменьшить потребление памяти. Фильтр Савицкого-Голея применялся для сглаживания координат положения и получения скоростей бега ( v ). После этого координаты положения были повернуты, чтобы способствовать ортогонализации между выходными метками.Наконец, все переменные ( x, y, v ) были масштабированы до [-1, 1] (рис. 2c). Что касается входных изображений, поле зрения (FOV) было обрезано до 224 на 224 пикселя с масштабированием значений (см. Материалы и методы).

    Перед обучением модели мы разделяем каждый набор данных на обучающий набор и тестовый набор. Разделив каждую сессию на пять последовательных периодов, мы выбрали один из них в качестве тестового набора. В литературе стратегия скользящего прогнозирования для разделения обучения/тестирования часто применяется к данным временных рядов, предполагая, что распределения не зависят от времени, что может быть неуместным, если животные меняют свои поведенческие сигнатуры с течением времени.

    3.1 Точное декодирование положения и скорости бега по необработанным микроэндоскопическим данным

    Чтобы напрямую расшифровать положение и скорость бега животного по необработанным данным визуализации, мы построили модель сверточной регрессии (ConvNet) (рис. 2d). В каждый момент времени в сеть, состоящую из двумерных сверточных слоев с активациями дырявого ReLU, за которыми следуют плотные слои, подавался один кадр. К последнему слою была применена операция Tanh. Гиперпараметры модели были найдены и определены на основе проверочного набора.Результаты показали, что наша модель ConvNet точно декодировала положение животных, а также скорость их бега из необработанных микроэндоскопических изображений в разных экспериментах (рис. 2e-h и дополнительный рисунок 2a-c). Путем сравнения производительности декодирования с нейронной сетью с прямой связью (FFNN), обученной на нейронных сигналах с шумоподавлением CNMFe, т. е. FFNN (normG), и моделью, обученной на сигналах ROI с удаленным фоном, т. е. FFNN (ROI) (см. Материалы и методы) , мы обнаружили, что с точки зрения прогнозирования позиций (рисунок 2g, слева) наша модель ConvNet имела меньшую медианную ошибку декодирования (10.17 ± 0,43 см), чем модель FFNN (ROI) (12,32 ± 0,72 см; ранговый критерий Вилкоксона: статистика = 54, 90 179 p 90 180 < 0,001) и модель FFNN (норма G) (10,74 ± 0,49 см; статистика = 135). , р < 0,05). Все эти модели были значительно лучше, чем случайный уровень (48,57 ± 2,67 см; 90 179 p 90 180 < 1 90 179 e 90 180 - 5). Что касается прогнозирования скорости бега (рис. 2g, справа), средняя ошибка декодирования нашей модели ConvNet (3,39 ± 0,14 см/с) была меньше, чем у модели FFNN (ROI) (3,62 ± 0,18 см/с; статистика = 121, 90 179). р < 0.05) и сопоставим с моделью FFNN(normG) (3,36 ± 0,14 см/с; статистика = 219, p = 0,78). Эти модели также были лучше уровня вероятности (4,66 ± 0,19 см/с; p < 1 e — 5).

    3.2 Остатки фона кодируют поведенческую информацию

    Учитывая, что наша модель ConvNet, обученная на необработанных микроэндоскопических записях, была способна декодировать положение и скорость лучше, чем декодер, обученный на нейронных сигналах, извлеченных из CNMFe, мы предположили, что остатки нейропиля/фона, часто отбрасываемые в визуализирующие исследования кодируют дополнительную поведенческую информацию, чем соматы клеток.

    Чтобы оценить, сколько поведенческой информации содержится в различных компонентах микроэндоскопической визуализации, мы создали несколько наборов изображений (рис. 3а), в том числе чистые изображения, состоящие только из соматических клеток, остаточные изображения, содержащие сигналы после вычитания сигналов нейронов из необработанных данных, и полые изображения. Изображения, на которых пространственные следы обнаруженных клеток были скрыты (см. Материалы и методы). Как показал пример набора тестов (рис. 3b), обе модели, обученные на необработанных и чистых изображениях, смогли декодировать поведенческие переменные ( x, y, v ) во времени.Удивительно, но модели, обученные на остаточных изображениях, все еще были способны предсказывать поведенческие следы (рис. 3б, в). Этот результат не был уникальным для одного набора тестов. Мы оценили все наборы данных из различных экспериментов по исследованию лабиринта (рис. 3d) и обнаружили, что позиции декодирования из остаточных изображений имели медианную ошибку (14,93 ± 1,04 см), сравнимую с декодированием из чистых изображений (11,03 ± 0,57 см; статистика = 165, p). = 0,16). Модели, обученные на Hollow ROI (13,46 ± 0,64 см) и Hollow A (15,13 ± 0,00 см).69 см) изображения имели значительно меньшую медианную ошибку декодирования, чем случайный уровень (48,57 ± 2,67 см; p < 1 e — 5).

    Рис. 3. Остатки нейропиля/фона кодируют поведенческую информацию.

    ( a ) Генерация данных для оценки информации, содержащейся в различных компонентах однофотонной визуализации кальция. Чистый: изображения, составленные только из нейронных сигналов с шумоподавлением. Остаток: Остатки от вычитания чистых изображений из необработанных. Полая область интереса: остатки с удаленной областью интереса.Пустота A: остатки с обнаруженными CNMFe следами клеток удалены. Подробности см. в разделе «Материалы и методы». ( b ) Примеры переменных, декодированных с использованием изображений, подготовленных в и из того же набора данных. Оранжевыми треугольниками отмечены моменты времени, когда мы можем легко увидеть различия в прогнозах между моделями. Серая линия обозначает истинные следы. Точки обозначают прогнозируемые трассы, окрашенные в зависимости от скорости бега. ( c ) Распределение ошибок положения (вверху) и скорости ( внизу ) декодирования в примере набора данных (такой же, как b ) по тестовым сгибам.( d ) Производительность модели для всех наборов данных. Вверху: декодирование позиций с использованием остаточных изображений (14,93 ± 1,04 см, синий) имело большую медианную ошибку, чем при использовании необработанных изображений (10,17 ± 0,43 см, зеленый; 90 179 p 90 180 < 0,01), но сравнимо с использованием чистых изображений (11,03 ± 0,57 см, оранжевый; р = 0,16). Оба изображения Hollow ROI (13,46 ± 0,64 см, розовый) и Hollow A (15,13 ± 0,69 см, салатовый) имели значительно меньшую медианную ошибку декодирования, чем уровень вероятности (48,57 ± 2,67 см; p < 1 e — 5) .Внизу: скорость декодирования с использованием остаточных изображений (3,66 ± 0,15 см/с, синий) имела большую медианную ошибку, чем при использовании необработанных изображений (3,39 ± 0,14 см/с, зеленый; 90 179 p 90 180 < 0,05), но в среднем такая же, как и при использовании чистых изображений. (3,54 ± 0,16 см/с, оранжевый; p = 0,46). Оба изображения Hollow ROI (3,63 ± 0,18 см/с, розовый) и Hollow A (3,78 ± 0,17 см/с, салатовый) имели значительно меньшую медианную ошибку декодирования, чем уровень вероятности (4,66 ± 0,18 см/с; 90 179 p 90 180 < 1 90 179 е — 5). Все значения p были получены с помощью знакового рангового критерия Уилкоксона.

    Если бы не было дополнительной информации, встроенной в остатки по сравнению с идентифицированными нейронами, мы бы наблюдали аналогичную производительность декодирования между моделями, обученными на необработанных и чистых изображениях. Вместо этого декодирование позиций из необработанных изображений без исключения информации имело меньшую медианную ошибку (14,93 ± 1,04 см), чем декодирование из чистых изображений (11,03 ± 0,57 см; статистика = 102, p <0,01). В некоторых случаях модель, обученная на остаточных изображениях, могла декодировать позиции даже лучше, чем на чистых изображениях (например, при использовании чистых изображений).г., по наборам данных исследования H-лабиринта: Остаток: 10,87 ± 0,42 см, Чистый: 12,25 ± 0,43 см; статистика = 4, p < 0,05). Эти результаты предполагают, что дополнительная информация о местоположении может быть встроена в остатки нейропиля/фона.

    3.3 Включение нескольких кадров во входные данные модели улучшает декодирование

    Предыдущие результаты были декодированы и проверены на покадровом уровне. Учитывая относительно медленную динамику кальция, мы также предполагаем, что включение нескольких кадров во входные данные улучшает производительность декодирования.Чтобы проверить эту гипотезу, мы модифицировали архитектуру ConvNet, чтобы включить несколько кадров во входные данные (подробности см. в разделе «Материалы и методы»).

    Когда не было ограничений на сверточные ядра, входные данные с 51 кадром исправили временное несоответствие в прогнозах по сравнению с однокадровым вводом (дополнительный рисунок 3a). Во всех наборах данных декодирование положения и скорости значительно улучшилось за счет включения нескольких кадров во входные данные (дополнительный рисунок 3b). В частности, использование 11 кадров (временное окно в 1 секунду) имело наименьшую медианную ошибку в прогнозировании положения (один кадр: 10.17 ± 0,43 см; 1-секундное временное окно: 7,50 ± 0,60 см; статистика = 5, p < 1 e — 5).

    Далее мы модифицировали архитектуру, добавив ограничение на свертки во временном измерении (рис. 4а). В частности, каждый кадр проходил через один и тот же блок сверточных слоев, веса которых распределялись между кадрами. Путем изучения веса внимания, приписываемого этим кадрам, информация о поведенческом состоянии извлекалась из разных моментов времени. Наблюдалось аналогичное улучшение декодирования за счет включения нескольких кадров во входные данные (рис. 4b).Изучив распределение усвоенных весов внимания для ввода с 51 кадром, мы обнаружили, что кадр изображения больше всего способствовал декодированию поведенческого состояния с задержкой (рис. 4c), предполагая, что будущие кадры изображения несут больше информации о поведенческих состояниях животного.

    Рисунок 4: Включение нескольких кадров во входные данные модели улучшает декодирование.

    ( a ) Схематическая диаграмма ConvNet изменена для включения нескольких кадров во входные данные. Каждый кадр во входных данных проходит через блок сверточных слоев, весовые коэффициенты которых распределяются между кадрами, и генерирует специфичный для кадра признак (т.г., F T t , F T , и F T 20 7 9 9 9 9 1 8 1 + Δ 90). Слой внимания изучает веса, присвоенные кадрам в разные моменты времени во входных данных. Средневзвешенный признак ( F post ) вводится в плотные слои. ( b ) Примеры переменных, декодированных из одного и того же набора данных с использованием однокадрового ввода ( слева ) и 51 кадра ( справа ), когда свертки были разделены между кадрами.Оранжевые треугольники отмечают моменты времени, когда мы можем легко увидеть различия в прогнозах между моделями. Серая линия обозначает истинные следы. Точки обозначают прогнозируемые трассы, окрашенные в зависимости от скорости бега. ( c ) Распределение усвоенных весов внимания для ввода с 51 кадром (Δ t = ± 2,5 секунды).

    3.4 Отдельные функциональные ансамбли идентифицируются по необработанным микроэндоскопическим изображениям

    Одной из проблем при использовании модели глубокого обучения является интерпретация того, какие функции получены из данных.Наша модель ConvNet смогла декодировать кинематику животного, но было неясно, как декодер извлекал поведенческую информацию из микроэндоскопических изображений.

    Чтобы понять, какая информация была извлечена из необработанных данных изображения, мы модифицировали алгоритм Grad-CAM (Selvaraju et al., 2017) для определения карт значимости в разных слоях модели (рис. 5а). В частности, карта значимости целевой единицы в определенном слое оценивалась с помощью комбинации карт признаков, взвешенных по градиенту (подробности см. в разделе «Материалы и методы»).Если бы декодер ConvNet использовал прежнюю стратегию обучения, карты значимости продемонстрировали бы однородные рассеянные паттерны. С другой стороны, если использовалась последняя стратегия, карты значимости, вероятно, идентифицировали ансамбли, состоящие из различных комбинаций ячеек и фоновых признаков. Мы обнаружили, что на ранней стадии обучения глобальная фоновая флуоресценция уже была сегментирована от нейронных сигналов по слоям, а края кластеров клеток были частично обнаружены в средних сверточных слоях (рис. 5b, вверху).Когда модель была хорошо обучена (т.е. после 26000 шагов), авторазложение возникло по разным слоям (рис. 5b, внизу). В частности, глобальные фоновые сигналы были сегментированы на ранних уровнях модели, но в более поздних слоях модели были идентифицированы отдельные ансамбли ячеек и фоновых признаков.

    Рисунок 5: Появление автодекомпозиции и функциональных кластеров.

    ( a ) Схема адаптированного алгоритма Grad-CAM. Сначала мы применяем обратное распространение градиентов целевого фильтра на определенном слое к ближайшему предыдущему сверточному слою.Градиентно-взвешенная комбинация карт признаков, за которой следует операция ReLU, дает предполагаемую карту значимости. Подробности см. в разделе «Материалы и методы». ( b ) карты значимости для разных слоев модели. Каждый квадрат соответствует карте заметности типичного блока/фильтра в этом слое. Для каждого слоя был показан пример подмножества карт значимости. Вверху: когда модель была обучена только с 500 шагами, глобальная фоновая флуоресценция и сигналы от соматических клеток или локальных нейропилей уже были сегментированы по слоям, а края объектов были обнаружены на основе яркости в средних сверточных слоях.Внизу: когда модель была хорошо обучена, авторазложение возникло на разных слоях. В ранних сверточных слоях аналогичные глобальные фоновые сигналы были сегментированы, тогда как в более поздних сверточных слоях были идентифицированы разные области интереса. ( c ) карты значимости для разных слоев модели, когда выходные метки были назначены случайным образом. Образовался другой процесс разложения.

    Кто-то может возразить, что сверточная модель может естественным образом обучаться идентификации объекта путем извлечения морфологических признаков из изображения, поэтому возникающая декомпозиция по слоям модели является просто побочным продуктом сверточной нейронной сети.Чтобы проверить эту гипотезу, мы сравнили карты значимости в модели, в которой выходные метки были назначены случайным образом. Если бы гипотеза была верна, мы бы ожидали подобных карт значимости. Вместо этого был сформирован другой процесс декомпозиции, когда отношения между входными изображениями и выходными метками были удалены (рис. 5c), что позволяет предположить, что автодекомпозиция, появившаяся в декодере ConvNet, была функционально релевантной.

    3.5 Дифференциальное кодирование топологии лабиринта по слоям

    Следуя предыдущим выводам, декодер идентифицировал различные функциональные ансамбли.Далее мы исследовали, как топология лабиринта была представлена ​​в этих ансамблях. Предыдущие исследования показали, что внутренняя динамика нейронного ансамбля часто занимает низкоразмерное многообразие в многомерном пространстве состояний (Archer et al., 2014; Churchland et al., 2012; Cueva et al., 2020; Mante et al. др., 2013). Здесь нейронный ансамбль состоит из состояний активности искусственных единиц в декодере. Чтобы извлечь представления из посещаемых единиц на каждом уровне обученной модели, мы спроецировали их активность в двумерное пространство состояний с помощью Isomap (см. Материалы и методы).Чтобы дополнительно изучить, как топология лабиринта была изучена на разных уровнях модели ConvNet, мы сопоставили каждое нейронное состояние с истинным положением животного в лабиринте (рис. 6а, б). Когда модель была хорошо обучена (рис. 6а), спроецированная активность точно фиксировала пересечение и каждое ответвление лабиринта в средних слоях модели, несмотря на то, что расстояния между этими нейронными состояниями не могли отражать реальную топологию лабиринта. Однако на более поздних уровнях модели спроецированные нейронные состояния начали отражать реальную топологию лабиринта.Мы также визуализировали представления ансамбля на ранней стадии обучения, ошибка проверки которых была вдвое выше, чем у полностью обученной модели (рис. 6b), и показали, что эти представления ансамбля на ранних уровнях были определены на раннем этапе обучения, тогда как поведенческая топология была сформирована на более позднем этапе. слоев на протяжении всей тренировки.

    Рисунок 6: Кодирование поведенческой топологии в многообразиях по слоям модели.

    ( a ) Представления ансамбля из разных слоев обученной модели в типичном наборе данных в экспериментах с Т-образным лабиринтом ( сверху ), Н-лабиринтом ( посередине ) и □-лабиринтом ( снизу ).Мы извлекли представления из посещаемых единиц на каждом уровне обученной модели и спроецировали их действия на двумерное пространство состояний с помощью Isomap. Каждая точка представляет поведенческое состояние, окрашенное истинным положением животного в лабиринте. 1-й столбец: Распределение позиций типичного животного. Другие столбцы: Топология позиций животных начала формироваться на более поздних слоях. Подробности см. в разделе «Материалы и методы». ( b ) Представления ансамбля из разных слоев модели на ранней стадии обучения, ошибка проверки которых была примерно в два раза.( c ) Сходство между нейронными многообразиями и поведенческой топологией. Сходство определялось как корреляция между парными расстояниями в нейронном многообразии и парными расстояниями в поведенческой топологии. Сходство значительно увеличилось от 6-го сверточного слоя к 7-му сверточному слою и еще больше увеличилось в последнем сверточном слое, а также в плотном слое в Т-образном лабиринте (фиолетовый), Н-лабиринте (золотой) и □-лабиринте (коричневый). ( d ) Сравнение нейронных многообразий в хорошо обученных моделях (черный цвет) и моделях, ошибки проверки которых были примерно вдвое (серый цвет).Во всех наборах данных множественное сходство было значительно выше у обученных моделей (черные), чем у обучаемых моделей (серые) на более поздних уровнях (критерий знакового ранга Уилкоксона: статистика = 1, p < 1 e — 5, тогда как такие разница была меньше, но все еще значима на более ранних слоях (критерий знакового ранга Вилкоксона: статистика = 98, p < 0,05). в нейронном многообразии и попарных расстояниях в физическом лабиринте.Как показано на рисунках 6c и d, сходство между каждым нейронным коллектором и лабиринтом увеличивалось от ранних слоев к более поздним слоям обученной модели (Ранний: 0,03 ± 0,01; Conv6: 0,29 ± 0,03; Conv7: 0,67 ± 0,01; Последний : 0,87 ± 0,01; Плотный: 0,91 ± 0,01) и был значительно выше по сравнению с моделями на ранней стадии обучения (Ранний: 0,03 ± 0,01, статистика = 98, p <0,05; Conv6: 0,26 ± 0,03, статистика = 117, p = 0,05 Conv7: 0,57 ± 0,03, статистика = 102, p < 0.05; Последняя: 0,70 ± 0,03; Плотность: 0,74 ± 0,03, статистика = 1, p < 1 e — 5) в различных экспериментах по исследованию лабиринта.

    В целом эти результаты показывают, что декодер представляет внутренние представления животного о лабиринте путем разложения топологии лабиринта по слоям.

    4 Обсуждение

    4.1 Эффект представления данных и архитектуры модели

    После демонстрации того, что модель ConvNet может напрямую извлекать информацию о поведении из необработанных микроэндоскопических данных, мы оценили, как представление данных влияет на производительность декодирования.В идеале мы хотели бы, чтобы выходные метки аппроксимировали равномерное распределение для обучения модели глубокого обучения. Однако скорость бега животных была сильно смещена в сторону более низких значений. Мы применили логарифмическое преобразование скоростей (дополнительный рисунок 4a) и повторно обучили подмножество моделей. Результаты показали, что исходная ConvNet, обученная с линейными скоростями (11,49 ± 0,13 см), имела значительно меньшую медианную ошибку в прогнозировании позиций, чем та же архитектура, обученная с логарифмическими скоростями (12.45 ± 0,14 см; p < 1 e — 5) (дополнительный рисунок 4b, слева). Точно так же средняя ошибка в прогнозировании скорости бега была значительно ниже в исходной модели, обученной линейным скоростям (3,76 ± 0,03 см/с), чем в модели, обученной логарифмическим скоростям (3,95 ± 0,04 см/с; 90 179 p 90 180 < 1 90 179 e — 5) (дополнительный рисунок 4b, справа). Этот результат согласуется с исследованиями, предполагающими, что нейроны в гиппокампе кодируют скорость бега линейным образом (Góis and Tort, 2018; Kropff et al., 2015), отличается от представлений в логарифмической шкале в сенсорной коре (Nover et al., 2005).

    Мы дополнительно оценили, как различные архитектуры моделей могут повлиять на производительность декодирования с нашими наборами данных. Первоначальная модель ConvNet предсказывала положение и скорость одновременно (дополнительный рисунок 5a, вверху). Мы предположили, что скоростное декодирование выиграло от совместной парадигмы обучения, а отдельная стратегия декодирования могла бы устранить эти преимущества. Мы модифицировали модель, чтобы иметь два отдельных декодера, один для положения, а другой для скорости (дополнительный рисунок 5a, внизу), и сравнили их производительность при прогнозировании положения и скорости бега животного (дополнительный рисунок 5b).Результаты показали, что модель с двумя отдельными декодерами улучшила предсказание положения (9,85 ± 0,42 см) по сравнению с исходной моделью с одновременным декодированием (10,17 ± 0,43 см; статистика = 133, 90 179 p 90 180 < 0,05), но за счет скорости. декодирования, т. е. его медиана ошибки (3,53 ± 0,16 см/с) была больше, чем у исходной модели (3,39 ± 0,14 см/с; stats = 131, p < 0,05).

    Мы также провели перенос обучения с помощью модели ResNet-50 и модели MobileNet (дополнительный рисунок 6a), чьи параметры извлечения признаков были предварительно обучены ImageNet и заморожены во время обучения модели, тогда как параметры в плотных слоях были обновлены на протяжении обучение (см. Материалы и методы).Мы также создали нейронную сеть с прямой связью для извлечения признаков из необработанных микроэндоскопических изображений после максимального объединения (дополнительная фигура 6a). Эти архитектуры с различными комбинациями гиперпараметров были оценены на проверочном наборе. Обнаружено, что модель ConvNet имеет меньшую среднюю потерю L1 (0,1361), чем трансферное обучение с ResNet-50 (0,2370) или MobileNet (0,2617) (дополнительный рисунок 6b). Вероятно, это было связано с тем, что характеристики изображений ImageNet сильно отличались от наших записей.Другая причина заключалась в том, что эти модели компьютерного зрения были разработаны для обнаружения объектов, но нашей целью было не сегментирование нейронов, а извлечение встроенной временной информации. Удивительно, но несмотря на то, что в литературе было предложено нормализацию партии для повышения производительности модели, мы обнаружили, что наша модель без нормализации партии имела меньшие потери L1 (0,1361), чем при использовании нормализации партии (0,1450). Мы подозревали, что пакетная нормализация устранила флуктуации между образцами, которые могли содержать информацию о поведении, и, таким образом, поставила под угрозу производительность декодирования.

    4.2 Как поведенческие состояния способствовали ошибкам декодирования

    При сравнении эффективности декодирования мы сосредоточились на периодах, когда животные бежали со скоростью выше 5 см/с (БЕГ), поскольку предыдущие исследования показали, что нейроны гиппокампа имели очень разные профили реакции, когда животное отдыхало или двигалось с очень низкой скоростью (STOP) (Ahmed and Mehta, 2012; Davidson et al., 2009; Geisler et al., 2007; Ólafsdóttir et al., 2017). Действительно, когда обученную ConvNet оценивали по периодам STOP, декодированные траектории сильно отличались от истинных траекторий, как если бы животное мысленно имитировало бег (дополнительная фигура 7a, b).

    Мы также исследовали нейронные коллекторы декодера в периоды STOP, чтобы оценить, как была представлена ​​топология лабиринта (дополнительная фигура 8a, b). Удивительно, но топология лабиринта не была полностью потеряна во время периодов СТОП. Вместо этого была получена глобальная топология лабиринта с нечеткими локальными структурами с уменьшенным сходством (Последний: 0,80 ± 0,02, статистика = 1, p <0,001; Плотность: 0,86 ± 0,02, статистика = 5, p <0,01) относительно к коллекторам в периоды RUN.

    Тем не менее, эти результаты продемонстрировали, как внутренние состояния животного (например, бегает ли животное или нет) могут способствовать ошибкам декодирования. Можем ли мы использовать его в качестве инструмента для изучения воспроизведения гиппокампа, выходит за рамки этого исследования.

    Что способствовало ошибкам декодирования в периодах RUN? Одной из распространенных причин было несоответствие между обучающими и тестовыми наборами. Чтобы оценить согласованность поведенческих переменных (90 179 x, y, v 90 180) между обучающими и тестовыми наборами, мы сравнили среднюю занятость и среднюю скорость в пространстве между обучающими и тестовыми наборами (дополнительный рисунок 1b и дополнительный рисунок 9a), на вычисление их двумерных корреляций ( r ).Результаты показали, что занятость и средняя скорость были в основном постоянными на протяжении всего сеанса, но снизились ближе к концу сеанса (в среднем r в Т-образном лабиринте: 0,71 ± 0,06, 0,74 ± 0,05, 0,78 ± 0,05, 0,76 ± 0,06, 0,71 ± 0,03; Н-лабиринт: 0,70 ± 0,03, 0,71 ± 0,02, 0,68 ± 0,06, 0,62 ± 0,04, 0,46 ± 0,13; □-лабиринт: 0,75 ± 0,03, 0,75 ± 0,03, 0,72 ± 0,03, 0,66 ± 0,05) .

    Мы также количественно оценили сходство каждой парной переменной, вычислив показатель индекса структурного сходства (SSIM) между обучающим и тестовым наборами (дополнительная фигура 9b).Если два совместных распределения имеют одинаковую структуру, SSIM = 1. Мы обнаружили, что совместные распределения в экспериментах с Т-образным лабиринтом были самыми высокими, а совместные распределения оставались одинаковыми на протяжении всего сеанса во всех наборах данных (средний SSIM в Т-образном лабиринте: 0,82 ± 0,03). ; Н-лабиринт: 0,72 ± 0,02; □-лабиринт: 0,64 ± 0,04).

    В целом, эти анализы показывают общую согласованность поведенческих переменных во времени, что позволяет предположить наличие других факторов, способствующих ошибкам декодирования. Одна из возможностей заключалась в том, что внутренний порог скорости бега различается у разных животных, так что некоторые периоды СТОП ошибочно принимались за периоды БЕГА, что приводило к ошибкам декодирования.Если бы это было так, мы бы наблюдали отрицательную корреляцию между ошибками декодирования и скоростью работы. Другой возможный источник ошибок декодирования связан с ограниченной временной точностью визуализации кальция. В этом случае мы бы наблюдали положительную корреляцию между ошибками декодирования и скоростью работы. Другой возможный фактор связан с систематической ошибкой выборки в обучающей выборке. Если бы имело место смещение в пространственной занятости, т. е. определенные позиции посещались животным больше, мы бы наблюдали смещение в прогнозах в сторону этих часто выбираемых позиций.

    Чтобы оценить эти факторы, визуализируйте, где ошибки декодирования произошли в лабиринте, а также куда они указывали (дополнительный рисунок 10a) и сравнили со средней заполненностью (xy Density) и картами скорости (AvgSpeed) как в обучении, так и в тесте. наборы (дополнительный рисунок 10b). Возьмем в качестве примера сеанс исследования Т-образного лабиринта (дополнительный рисунок 10a, b), где указанная ошибка декодирования в основном коррелировала с картой AvgSpeed ​​обучающего набора ( r = 0,61) по сравнению с тестовым набором ( r = 0.51) и плотности x-y (тренировочный набор: r = 0,38; тестовый набор: r = 0,34). Напротив, место, где произошла ошибка декодирования, в основном коррелировало с картой AvgSpeed ​​тестового набора ( r = 0,81), относительно тренировочного набора ( r = 0,62) и плотностью xy (тренировочный набор: r = 0,50). ; набор тестов: r = 0,52). Этот результат был одинаковым для всех моделей (дополнительная фигура 10c). Там, где обнаружены неправильные прогнозы, больше коррелировали с картой AvgSpeed ​​обучающей выборки ( r = 0.56 ± 0,02; stats = 134, p < 0,05), тогда как место возникновения ошибки в основном коррелировало с картой AvgSpeed ​​тестового набора ( r = 0,78 ± 0,01, синий; ранговый критерий Уилкоксона: статистика = 1, p < 1 e − 5)

    4.3 Информация, встроенная в фоновые остатки

    Наши результаты показывают, что поведенческие переменные, такие как положение и скорость, могут быть напрямую декодированы из необработанных микроэндоскопических изображений без необходимости специфической идентификации предполагаемых нейронов и/или деконволюции. шипы.Наш подход, основанный на ConvNet, превосходит нейронную сеть с прямой связью, которая принимает в качестве входных данных шумовые следы кальция, предполагая, что нейропиль/фон, который фильтруется в типичном конвейере анализа кальция, кодирует поведенческую информацию. Можно возразить, что эта разница в производительности обусловлена ​​различной архитектурой декодера или входными параметрами. Однако, генерируя изображения, состоящие из изолированных компонентов фона и переднего плана, в качестве входных данных для декодера ConvNet, мы показали, что остаточные сигналы кодируют положение и скорость животного.Закрывая пространственные следы нейронов, при этом в основном оставались сигналы нейропиля, мы исключили возможность успешного декодирования, являющегося побочным продуктом неполного извлечения источника в ROI. Наши результаты показывают, что нейропиль/фон при однофотонной визуализации кальция в CA1 гиппокампа содержит пространственную информацию.

    Сигналы нейропиля считаются расфокусированными флуоресцентными сигналами от близлежащих клеточных процессов, включая дендритные шипики и сегменты аксонов (Gobel and Helmchen, 2007; Kerr et al.,2005; Ohki et al., 2005), и часто удаляются при анализе изображений кальция (Keemink et al., 2018; Lu et al., 2018; Pachitariu et al., 2017; Pnevmatikakis et al., 2016; Zhou et al. ., 2018). Тем не менее, исследования показали, что дендритная флуоресценция может демонстрировать кальциевые переходные процессы в ответ на синаптические входы, потенциалы действия обратного распространения и дендритные спайки (Kleindienst et al., 2011; Larkum et al., 1999; Svoboda et al., 1999; Takahashi et al. al., 2012; Yuste, Denk, 1995), которые важны для обработки информации.Например, дендритные спайки в сенсорной коре могут способствовать ориентационной избирательности (Euler et al., 2002; Sivyer, Williams, 2013; Smith et al., 2013) и угловой настройке (Lavzin et al., 2012). Кроме того, дендритные сигналы в СА1 могут модулировать поля мест и индуцировать новые образования полей мест для обеспечения избирательности признаков (Bittner et al., 2015; Sheffield and Dombeck, 2015).

    Точно так же визуализация аксонов кальция показала, что отдельные аксоны могут кодировать переменные, связанные с задачей, такие как прикосновение и взмахивание (Petreanu et al., 2012). Вместе они предполагают, что сигналы нейропиля, включающие активность как дендритов, так и аксонов, кодируют внешние стимулы и поведенческую информацию. Эта гипотеза подтверждается нашими результатами, согласующимися с предыдущими исследованиями, которые демонстрируют, что как соматы клеток, так и участки нейропиля могут отражать целенаправленное поведение (Allen et al., 2017), а также ориентацию движущихся решеток (Lee et al., 2017). . Чтобы выделить вклад дендритов, аксонов и соматических клеток вне фокуса в фоновые сигналы, индикатор кальция, который специфически локализуется в соме (например,g., SomaGCaMP (Shemesh et al., 2020)) или аксон (например, аксон-GCaMP6 (Broussard et al., 2018)) потребуется для будущих экспериментов. В целом, наше исследование ставит под сомнение идею удаления фоновых сигналов из данных визуализации кальция и предлагает пересмотреть конвейер анализа для извлечения поведенческой информации из микроэндоскопических данных.

    4.4 Вклад нашей парадигмы сквозного декодирования

    В дополнение к раскрытию информации, встроенной в фон изображения, наша работа не требует сложной настройки гиперпараметров, которая требует предварительных знаний, и предоставляет простую в реализации структуру для поведения декодирования. из данных изображения.В литературе было предложено много методов для декодирования положения по активности группы одиночных нейронов в гиппокампе, но они требуют либо сортировки спайков для электрофизиологических записей (Brown et al., 1998; Wilson and McNaughton, 1993; Zhang et al. , 1998) или вывод пиков для данных визуализации кальция (Etter et al., 2020; Gonzalez et al., 2019; Shuman et al., 2020; Stefanini et al., 2020; Ziv et al., 2013). Хотя были разработаны альтернативные методы декодирования для визуализации кальция, чтобы обойти деконволюцию спайков, такие как непосредственная оценка частоты возбуждения нейронов (Ganmor et al., 2016), аппроксимация всплесков с отмеченным точечным процессом (Tu et al., 2020) или декодирование с использованием частотных представлений (Frey et al., 2019), все они требуют извлечения следов флуоресценции из идентифицированных отдельных нейронов. С другой стороны, разрабатываются новые статистические методы для декодирования положения с помощью несортированных спайков или потенциалов локального поля в электрофизиологии (Cao et al., 2019; Deng et al., 2015; Frey et al., 2019; Kloosterman et al., 2014). ). Однако эта идея никогда не применялась в однофотонной визуализации кальция.Это исследование является первой демонстрацией прямого декодирования поведения из необработанных микроэндоскопических данных без необходимости разделения сигналов отдельных нейронов.

    Наш подход основан на силе глубокого обучения. Благодаря недавним достижениям в области машинного обучения были предприняты попытки использовать модели глубокого обучения, такие как рекуррентная нейронная сеть, для изучения скрытых функций из нейронных данных и декодирования поведения животных с высокой точностью (Glaser et al., 2020; Tampuu et al., 2019). ). Однако эти усилия по-прежнему основаны на идентификации отдельных нейронов и, к сожалению, не в полной мере используют методы глубокого обучения для извлечения информации из зашумленных данных.Наш сквозной декодер встраивает все этапы предварительной обработки в сеть. Кроме того, мы адаптировали алгоритм Grad-CAM (Selvaraju et al., 2017) для поиска карт значимости по слоям декодера. Мы выбрали Grad-CAM, учитывая его уменьшенные визуальные артефакты (Adebayo et al., 2018) и более плавные карты заметности по сравнению с другими подходами, такими как Vanilla Gradients (Simonyan et al., 2013), Guided Backpropagation (Springenberg et al., 2014) и Деконволюция (Zeiler and Fergus, 2014). Однако у этого метода есть ограничения по захвату мелких деталей.Тем не менее, наши результаты показали, что декомпозиция видео автоматически возникает в обученном декодере, и идентифицировали кластеры, состоящие из разных групп клеток и участков нейропиля для пространственных представлений в СА1. Эти результаты предлагают альтернативный способ классификации нейронной активности путем визуализации карт значимости декодера без необходимости запуска дополнительного алгоритма кластеризации.

    В заключение мы (1) продемонстрировали эффективный и простой в реализации декодер необработанных микроэндоскопических данных, (2) выявили дополнительные поведенческие репрезентации, встроенные в фон нейропиля, и (3) предложили метод идентификации кластеров, релевантных для извлечения информация о положении и скорости в нейронных данных.Мы считаем, что наш анализ декодирования может быть расширен для изучения представлений других областей мозга, таких как энторинальная кора, первичная зрительная кора и теменная кора, лежащих в основе различных поведенческих задач, с потенциальными приложениями для декодирования в реальном времени и управления с обратной связью.

    Вклад авторов

    C.-J.C. и М.А.В. задумал проект; К.-Дж.К. разработал модели и эксперименты, проанализировал данные и написал код; В.Г. и Дж.Дж.З. предоставили данные о поведении животных и изображениях кальция; Дж.П.Н. разработанные методы сбора данных; WG реализовала алгоритм CNMFe и пометила данные; С.-Х.С. предоставил консультацию по инфраструктуре Tensorflow; C.-J.C подготовил рукопись; M.A.W. курировал проект. Все авторы участвовали в редактировании рукописи.

    Дополнительные рисунки

    Дополнительный рисунок 1: Примеры H-образного лабиринта, T-образного лабиринта и □-образного лабиринта.

    ( a ) Схематические диаграммы Н-образного лабиринта ( вверху ), Т-образного лабиринта ( посередине ) и □-лабиринта ( внизу ) исследовательских экспериментов.( b ) Оценка разделения поезд/тест для каждого исследования лабиринта. Слева: кумулятивная функция плотности (CDF) каждой метки между обучающими и тестовыми наборами. Справа: средняя заполняемость (плотность x-y) и карты скорости (AvgSpeed) для типичного разделения поезд/испытание. Для примера набора данных H-лабиринта, T-лабиринта и □-лабиринта его двумерная корреляция между обучающими и тестовыми наборами: r(x-y Density) = 0,7230, 0,9154 и 0,5232 соответственно; r(AvgSpeed) = 0,7678, 0,7379 и 0,6612 соответственно.

    Дополнительный рисунок 2: Примеры декодированных следов бега в Т-образном и Н-лабиринте.

    ( a ) Вверху: пример 10-секундной траектории животного в эксперименте по исследованию Т-образного лабиринта. Внизу: пример 10-секундной траектории животного в исследовательском эксперименте в Н-образном лабиринте. ( b ) Декодированные переменные во времени в тестовом наборе T-образного лабиринта. Средняя ошибка декодирования x, y и v: 2,95 см, 6,15 см, 3,12 см/с соответственно. ( c ) Декодированные переменные во времени в примере набора тестов Н-лабиринта. Средняя ошибка декодирования x, y и v: 5,53 см, 9,94 см, 3,65 см/с соответственно.

    Дополнительный рисунок 3: Оптимальное декодирование с использованием 1-секундного ввода и сверток, не зависящих от времени.

    ( a ) Примеры переменных, декодированных из одного и того же набора данных с использованием однокадрового ввода ( слева ) и 51 кадра ( справа ), когда свертки не зависят от времени. Оранжевые треугольники отмечают моменты времени, когда мы можем легко увидеть различия в прогнозах между моделями. Серая линия обозначает истинные следы. Точки обозначают прогнозируемые трассы, окрашенные в зависимости от скорости бега.( b ) Производительность модели для всех наборов данных. Вверху: включение 11 кадров (временное окно 1 с) привело к наименьшей медианной ошибке декодирования положения (7,50 ± 0,60 см), что значительно отличается от ввода одного кадра (10,17 ± 0,43 см; статистика = 5, p < 1 e − 5). Внизу: включение 51 кадра (временное окно 5 с) привело к наименьшей медианной ошибке декодирования скорости (2,42 ± 0,09 см/с), что значительно отличается от ввода одного кадра (3,39 ± 0,14 см/с; статистика = 1, p < 1 e − 5).

    Дополнительный рисунок 4: Производительность декодирования с преобразованием журнала на рабочих скоростях.

    ( a ) Схематическая диаграмма подготовки данных с логарифмическим преобразованием скоростей для создания логарифмически равномерного распределения. ( b ) Производительность модели для подмножества наборов данных в разных тестовых сгибах. Слева: исходная модель, обученная с линейными скоростями (11,49 ± 0,13 см, шалфей), имела значительно меньшую медианную ошибку в прогнозировании положения, чем та же модель, обученная с логарифмическими скоростями (12.45 ±0,14 см, кардинальное; Критерий знакового ранга Уилкоксона: статистика = 15274374, p < 1 e — 5). Справа: исходная модель, обученная линейным скоростям (3,76 ± 0,03 см/с, мудрец), имела значительно меньшую медианную ошибку в прогнозировании скоростей, чем та же модель, обученная логарифмическим скоростям (3,95 ± 0,04 см/с, кардинальное значение; критерий знакового ранга Вилкоксона). : статистика = 15506009, p < 1 e − 5).

    Дополнительный рисунок 5: Производительность сети с отдельными потоками для поведения декодирования.

    ( a ) Схематическая диаграмма архитектур ConvNet с исходными стратегиями одновременного (вверху) и раздельного (внизу) декодирования. ( b ) Производительность модели для всех наборов данных. Вверху: Исходная модель с одновременным декодированием (10,17 ± 0,43 см, шалфей) имела значительно большую медианную ошибку в предсказании положения, чем модель с отдельными потоками декодирования (9,85 ± 0,42 см, кардинал; ранговый критерий Уилкоксона: статистика = 133, 90 179 р 90–180 < 0,05). Внизу: оригинальная модель (3.39 ± 0,14 см/с, шалфей) имела значительно меньшую медианную ошибку в прогнозировании скоростей, чем модель с отдельными потоками декодирования (3,53 ± 0,16 см/с, кардинально; критерий знакового ранга Уилкоксона: статистика = 131, p <0,05) .

    Дополнительный рисунок 6: Выбор модели с поиском гиперпараметров.

    ( a ) Схематическая диаграмма различных архитектур моделей. Мы передали обучение с помощью модели ResNet (вверху) и модели Mobilenet (в центре), предварительно обученных в Imagenet. Мы также разработали нейронную сеть с прямой связью, в которой максимальное объединение применялось к входным изображениям перед подачей сглаженных функций в плотные слои.Поиск по гиперпараметрам применялся ко всем моделям, и наилучшая комбинация выбиралась на основе результатов проверки. Подробности см. в разделе «Материалы и методы». ( b ) Сравнение моделей на проверочном наборе. Мы сравнили все модели с их лучшими наборами гиперпараметров и обнаружили, что модель ConvNet имеет наименьшие средние потери L1. ( c ) Подмножества поиска гиперпараметров в проверочном наборе. Для модели ConvNet с 8 свёртками с 8 свёрточными слоями и 5 плотными слоями мы обнаружили, что обучающая модель со скоростью обучения 1e-4 без пакетной нормализации имеет наименьшую среднюю потерю L1.Эти гиперпараметры использовались для моделей во всех экспериментах.

    Дополнительный рисунок 7: Примеры декодированных трасс в периоды STOP и обучающий набор.

    ( a ) Пример 10-секундных траекторий истинного (серый) и расшифрованного (черный) положений, когда животное в основном находилось в неподвижном состоянии. Расшифрованные следы образовывали последовательность, как если бы животное имитировало бег. ( b ) Декодированные переменные во времени во время периодов STOP в примере набора тестов. Серая линия обозначает истинные следы. Зеленые точки обозначают предсказанные трассы.( c ) Декодированные переменные во времени в примере обучающего набора. Точки обозначают прогнозируемые следы, окрашенные в фактические скорости бега.

    Дополнительный рисунок 8: Кодирование поведенческой топологии во время периодов STOP в коллекторах по слоям модели.

    ( a ) Представления ансамбля из последнего сверточного слоя и плотного слоя обученной модели в типичном наборе данных в Т-образном лабиринте ( сверху ), H-лабиринте ( посередине ) и □-лабиринте ( внизу ) (те же модели, что и в рис. 7a ).( b ) Сравнение нейронных коллекторов, извлеченных из периодов БЕГА и СТОП (т. е. животные были либо неподвижны, либо бегали со скоростью ниже 5 см/с), в Т-образном лабиринте ( слева ), Н-лабиринте ( посередине) ) и □-лабиринт (справа). Во всех наборах данных многократное сходство было значительно выше, когда животные бегали (критерий знакового ранга Уилкоксона: статистика = 1, p <0,05).

    Дополнительный рисунок 9: Согласованность поведенческих распределений между обучающими и тестовыми наборами.

    ( a ) Сходство средней занятости (плотность x-y) и средней скорости (AvgSpeed) между обучающей и тестовой выборками. Вверху: двухмерные корреляции карт занятости и скорости в разных лабиринтах. Внизу: все двухмерные корреляции (плотность x-y, средняя скорость) для тестовых складок. ( b ) Оценка разделения поезд/тест с использованием показателей индекса структурного подобия (SSIM) для совместных распределений выходных меток. Вверху: SSIM для каждой парной переменной ( x, y ), ( x, v ) и ( y, v ) в различных экспериментах с лабиринтом.Внизу: SSIM (( x, y ), ( x, v ) и ( y, v )) на тестовых складках в различных экспериментах с лабиринтом.

    Дополнительный рисунок 10: Возможные факторы, способствующие ошибкам декодирования.

    ( a ) Визуализация ошибок в пространстве из примера набора данных исследования Т-образного лабиринта. Тепловые карты представляют собой декодированные ошибки (а.е.) перед преобразованием обратно в исходные масштабы (см и см/с). Слева: пространственные карты мест возникновения ошибок декодирования. Справа: пространственные карты того, куда указывали ошибки (т.э., где были неверные прогнозы). ( b ) Слева: карты средней занятости (плотность x-y) тренировочного набора сверху и тестового набора снизу из примера набора данных a . Справа: карты средней скорости (AvgSpeed) тренировочного набора сверху и тестового набора снизу из примера набора данных и . Двумерные корреляции ( r ) между этими картами и картами ошибок были рассчитаны для оценки потенциальных факторов, влияющих на декодированные ошибки.Здесь, где указанная ошибка в основном коррелировала с картой AvgSpeed ​​обучающего набора ( r = 0,61, справа, вверху), а где произошла ошибка, в основном коррелировала с картой AvgSpeed ​​тестового набора ( r = 0,81 , справа, снизу ). ( c ) Во всех наборах данных, где указанная ошибка была больше коррелирована с картой AvgSpeed ​​обучающего набора ( r = 0,56 ± 0,02, зеленый; ранговый критерий Уилкоксона: статистика = 134, p <0,05 ) по отношению к другим факторам, но в целом корреляции были слабыми.С другой стороны, место, где произошла ошибка, в основном коррелировало с картой AvgSpeed ​​тестового набора ( r = 0,78 ± 0,01, синий; критерий знакового ранга Уилкоксона: статистика = 1, p < 1 e — 5 )

    5 Материалы и методы

    5.1 Сбор данных

    Всего в экспериментах использовали 8 самцов мышей с фоном C57/B6. Все процедуры были одобрены Комитетом Массачусетского технологического института по уходу за животными и соответствовали рекомендациям, установленным Национальным институтом здравоохранения для ухода и использования лабораторных животных.

    Опосредованная вирусом доставка генов

    Сначала животных анестезировали 5% изофлураном в кислороде. На протяжении всей процедуры животных подвергали анестезии на стереотаксической хирургической раме (Kopf) с постоянным от 1,5% до 2% изофлюрана в кислороде. Трепанационное отверстие делается на расстоянии -1,5 мм медиально-латерально и 2,1 мм рострально-каудально от ориентира Брегмы. Используя моторизованный инжектор со скоростью 0,05 мк 90 180 л/мин, 0,5 90 179 мк 90 180 л pGP-AAV1-syn-jGCaMP7f-WPRE (титр: 1,9 x 1012 гк/мл) вводили в 1.5 мм под поверхностью черепа в трепанационном отверстии. После этого на кожу головы накладывали швы и вводили анальгетик (бупренекс, 0,05 мг/кг) до выздоровления животных.

    Протокол имплантации

    После инъекции вируса имплантацию линзы GRIN и имплантацию базовой пластины проводили отдельно. Во время имплантации животных анестезировали по тому же протоколу.

    Линза GRIN

    Поверхность черепа была обработана травильным гелем (C&B Metabond). Трепанация черепа 2 мм на 2.На черепе сделали трепанацию диаметром 2 мм, в центре – трепанационное отверстие от процедуры введения вируса. Корковая ткань была аспирирована, обнажая рострально-каудальную исчерченность прямо над СА1. Линза GRIN (диаметр 1,8 мм, шаг 0,25, 670 нм, Edmund) располагалась перпендикулярно поверх СА1 и фиксировалась к черепу клеем (Loctite 454). После этого обнаженный череп и область вокруг линзы GRIN были покрыты прозрачным стоматологическим цементом (C&B Metabond), а затем черной ортодонтической акриловой смолой, чтобы блокировать окружающий свет.Верх линзы GRIN был покрыт силиконовым клеем (Kwik-Sil).

    Опорная пластина

    С опорной пластиной, прикрепленной к микроэндоскопу (минископ UCLA), оптимальное поле зрения (FOV) было найдено с помощью визуализации и ручной регулировки угла крепления опорной пластины. После того, как было достигнуто оптимальное поле зрения, базисную пластину сначала зафиксировали на месте с помощью клея (Loctite 454), а затем прикрепили к черепу с помощью стоматологического цемента (M&B metabond).

    Установка визуализации

    Однофотонная визуализация кальция выполнялась с помощью минископа, устанавливаемого на голове.Мощность визуализации составляла примерно от 1 мВт до 10 мВт с поправкой на каждое животное. Светодиод возбуждения фильтруется полосовым фильтром 470/40. Испускаемые фотоны собирались датчиком CMOS, фильтровались полосовым фильтром 525/50 с частотой дискретизации 30 Гц. Поле зрения изображения составляло 480 на 752 пикселя, а оптимальная плоскость была достигнута во время имплантации базовой пластины.

    5.2 Поведенческие задачи

    После того, как животные полностью восстановились после предыдущих процедур (примерно через 3 дня после имплантации базовой пластины), на бодрствующих животных было проведено записей in vivo.

    Акклиматизация минископа в домашней клетке

    Животных прикрепляли к кабелям для визуализации, что позволяло им акклиматизироваться к минископу и привязываться в течение нескольких сеансов в домашней клетке, каждый сеанс длился 30 минут. Эта процедура повторялась в течение примерно 3 дней, пока животные не освоились с настройкой визуализации и не начали вести себя нормально.

    Эксперименты по исследованию лабиринта

    После сеансов акклиматизации с минископом животные подвергались экспериментам по исследованию лабиринта, в которых ограждения лабиринта были сделаны из гофрированных пластиковых листов (Home Depot).Формы этих лабиринтов можно разделить на Т-образные, Н-образные или □-образные. Каждый лабиринт имеет размер примерно 1 м на 1 м. Для каждого лабиринта животные проходили несколько сеансов, каждый сеанс длился около 30 минут. В нашем исследовании мы исключили первые несколько сеансов, когда конфигурация лабиринта была еще новой для животных, и использовали данные только в более поздних сеансах, когда животные уже были знакомы с окружающей средой.

    5.3 Подготовка набора данных

    Поведенческие данные

    Для отслеживания поведения животных мы использовали веб-камеру с частотой дискретизации 60 Гц и синхронизировали изображения с помощью пакета (https://github.com/jonnew/Bonsai.Miniscope) для бонсай (Lopes et al., 2015). Красная лента на минископе, установленном на голове, отслеживалась как прокси для местоположения животного, сообщаемого как координаты положения ( x, y ).

    Временная субдискретизация и сглаживание

    Необработанные координаты x, y были субдискретизированы до 10 Гц и сглажены сглаживающим фильтром квадратичного порядка с конечной импульсной характеристикой Савицкого-Голея. Скорость v была дополнительно оценена по этим сглаженным координатам x, y.

    Ортогонализация координат

    Линейные зависимости между различными размерами выходных меток были минимизированы путем ортогонализации сглаженных координат x, y.Для Т-образного лабиринта координаты x, y были центрированы на пересечении двух перпендикулярных рукавов. Для H-лабиринта и □-лабиринта координаты x, y были центрированы в середине лабиринта. После центрирования жесткая матрица вращения (R) оценивалась посредством разложения по сингулярным числам (SVD) и применялась для ортогонализации координат x, y.

    Масштабирование меток

    Все поведенческие метки ( x, y, v ) были масштабированы в диапазоне [-1, 1].

    Calcium Imaging
    Удаление артефактов движения

    Для коррекции артефактов неравномерного движения, вызванных движением мозга, был применен NoRMCorre, метод быстрой нежесткой регистрации (Pnevmatikakis and Giovannucci, 2017).Этот алгоритм работает путем разделения FOV на перекрывающиеся пространственные участки, которые затем регистрируются с субпиксельным разрешением для жесткого перемещения по шаблону. После этого было создано сглаженное поле движения для каждого кадра путем повышающей дискретизации предполагаемых совмещений.

    Пространственное понижение дискретизации и кадрирование

    Изображения были уменьшены в каждом измерении в 2 раза, что привело к размеру 240 на 376 пикселей. Поле зрения было обрезано до 224 на 224 пикселя путем удаления окружающих областей, не содержащих сигналов кальция.

    Исходное разложение и шумоподавление

    Этот шаг применялся только для генерации данных для базового декодера (т. е. он был пропущен для нашего сквозного декодера). Для отделения различных источников, таких как одиночные нейроны и нефокусная флуоресценция от нейропиля, был применен алгоритм CNMFe (Zhou et al., 2018). Гиперпараметры, такие как предполагаемый диаметр нейрона, были оптимизированы для набора данных каждого животного. Средние кривые флуоресценции C из областей интереса (ROI) были извлечены и очищены от шума посредством деконволюции пиков.ROI со слабой (пик C ниже 100% dF/F) или спорадической активностью (менее 3 кальциевых переходных процессов) были исключены. Предполагалось, что остальные ROI являются предполагаемыми нейронами. Временные действия C использовались в качестве входных данных для базового декодера.

    Временная субдискретизация

    Изображения кальция были субдискретизированы до 10 Гц.

    Масштабирование пикселей

    Амплитуды необработанных пикселей изображения (0-255) были масштабированы в диапазоне [-1, 1].

    Эксперимент с остаточной информацией
    Raw

    Этот набор состоял из исходных изображений ( Y ) после удаления артефактов движения, кадрирования FOV и масштабирования пикселей.

    Чистый

    Матрица видео была получена после алгоритма CNMFe путем умножения матрицы пространственного следа A на матрицу временной динамики C . Кадры изображений из этой видеоматрицы содержали только предполагаемые нейроны и поэтому были названы чистыми изображениями.

    Остаточные

    Остаточные изображения были получены путем вычитания чистых изображений из необработанных изображений, т. е. Y AC . Теоретически релевантная для поведения информация на этих изображениях поступала из фоновых остатков, поскольку любые временные колебания предполагаемых нейронов, вызванные спайками, были извлечены в матрицу временной динамики C .В идеале в остаточных изображениях отсутствует информация от предполагаемых нейронов. Однако алгоритм CNMFe обновляет параметры с помощью чередующихся итераций, так что временные колебания, вызванные всплеском, могут быть не полностью зафиксированы в чистых изображениях. Чтобы еще больше исключить информацию, вызванную спайками, оставшуюся на остаточных изображениях, местоположения предполагаемых нейронов были скрыты с помощью методов Hollow ROI или Hollow A.

    Полая область интереса

    Изображения полой области интереса были получены после закрытия предполагаемых клеток после установки локального адаптивного порога.Порог вычислялся для каждого пикселя в соответствии с характеристиками изображения в движущемся круглом окне. Локальный порог вычислялся по методу Ниблэка: где k = 0,2, c = 0, μ — среднее значение пикселя в пределах окна, а σ — стандартное отклонение значений пикселя в пределах окна.

    Hollow A

    Изображения Hollow A были получены после окклюзии всей матрицы пространственного следа A из остаточных изображений. Это дополнительно удалило любые локальные сигналы, связанные с каждой ячейкой.

    Скремблирование изображений

    Каждый пиксель в каждом изображении был случайным образом переставлен в каждой строке. Распределения пикселей остались идентичными, но пространственные закономерности были разрушены.

    Случайные изображения

    Кадры изображения были синтезированы путем выборки каждого пикселя из равномерного распределения, которое имело тот же минимум и максимум, что и исходные кадры изображения. Синтезированные изображения представляли собой случайный шум. В качестве уровня вероятности использовались декодеры, обученные на случайных изображениях.

    5.4 Моделирование декодера

    Оценка набора данных
    Разделение набора данных Train/val/test

    Набор данных был разделен на периоды «RUN» и «STOP» на основе скорости бега с порогом разделения 5 см/с.Для большей части обучения и оценки нашей модели период «СТОП» был исключен из анализа, если не указано иное. Набор данных каждого животного был сегментирован на 5 последовательных блоков. Следуя правилу разделения 80-20, один из этих блоков был выбран в качестве тестового набора, а остальные использовались в качестве обучающего набора. На этапе разработки модели обучающий набор был разделен на 5 последовательных блоков, один из которых был выбран случайным образом в качестве проверочного набора.

    Показатели сходства для совместного распределения

    Для количественной оценки сходства между совместным распределением парных переменных (( x, y ), ( x, v ), ( y, v )) между обучающей выборкой и тестом набор, мера индекса структурного сходства (SSIM) (Wang et al., 2004) был выполнен с использованием библиотеки scikit-image . Совместное распределение обучающего набора рассматривалось как изображение (Im , поезд ), как и совместное распределение тестового набора (Im , тест ). Каждое изображение свертывалось с нормализованным ядром Гаусса шириной 90 179 σ 90 180 = 1,5, что приводило к множеству патчей. SSIM рассчитывался на основе различных патчей из двух изображений. где c 1 и c 2 — константы, μ и σ — статистические признаки всех этих пятен.Если SSIM = 1, два изображения совместных распределений имеют одинаковые текстуры. Более низкий SSIM предполагает больше различий между двумя наборами.

    Метрики сходства для карты средней занятости и карты средней скорости

    Карта занятости, т. е. карта плотности x-y, представляет собой двумерный шестиугольный график биннинга, количественно определяющий нормализованную занятость в лабиринте. Карта средней скорости, то есть карта AvgSpeed, представляет собой двумерный шестиугольный график биннинга, определяющий среднюю скорость в лабиринте. 25 бинов использовались в направлениях x и y. Для количественной оценки сходства карты занятости и карты средней скорости между обучающим набором и тестовым набором использовался коэффициент двумерной корреляции ( r ).Если r = 1, это предполагает, что обучающая и тестовая выборки имеют одинаковые карты. Меньшее значение по сравнению с указывает на большую разницу между двумя наборами.

    Базовый декодер

    В качестве базового декодера мы использовали нейронную сеть с прямой связью с головкой регрессии и идентифицировали ROI как предполагаемые нейроны на микроэндоскопических изображениях и построили декодер на основе временной активности этих ROI. Средние следы флуоресценции от N идентифицированных ROI формировали N-мерный вход, а декодер выдавал положение животного и скорость бега.Учитывая, что производительность декодирования зависит от входных представлений, мы подготовили различные представления следующим образом.

    Сглаженные следы ROI после удаления фона (FFNN(ROI))

    Сначала мы получили проекцию средней интенсивности из стеков изображений, а затем размыли проекционное изображение с помощью движущегося 2D-фильтра Гаусса с размером около 25% FOV , используя ImageJ (Schindelin et al., 2012). Размытая проекция считалась глобальным фоном и вычиталась из всех необработанных изображений.Впоследствии была применена операция анизотропной диффузии (Perona and Malik, 1990) для дальнейшего устранения шума на изображениях, за которой последовала операция морфологического раскрытия с использованием кругового структурного элемента, размер которого подобен размеру нейрона в поле зрения. После этого мы получили проекцию максимальной интенсивности из изображений с удаленным шумом, фон которых был удален, и аннотировали области интереса с помощью инструмента ImageJ Cell Magic Wand. Средняя кривая флуоресценции для каждой области интереса сглаживается сглаживающим фильтром Савицки-Голея.

    Глобально нормализованные трассы с шумоподавлением из CNMFe (FFNN(normG))

    Другое входное представление было создано с помощью временных трасс с шумоподавлением с помощью алгоритма CNMFe (Zhou et al., 2018). Средняя трасса флуоресценции C для каждой ROI была нормализована глобальным максимумом по всем трассам. При этой процедуре корреляции между нейронами были информативными и, таким образом, относительные величины между ними сохранялись.

    Сквозной декодер с входными изображениями
    Задача регрессии

    Сквозной декодер принимал каждый кадр изображения в качестве входных данных и предсказывал поведенческие атрибуты животного (положение и/или скорость) в соответствующий момент времени.Проблема декодирования может быть сформулирована как задача классификации нескольких классов путем группирования поведенческих переменных, но мы решили сформулировать проблему как задачу регрессии по следующим причинам. Во-первых, животные свободно исследовали лабиринт, поэтому заселенность лабиринта и распределение скорости бега были сильно несбалансированными. Тем не менее, размер данных был недостаточно большим для недостаточной выборки данных для создания равномерного распределения, но при избыточной выборке классов меньшинств с использованием таких методов, как SMOTE (Chawla et al., 2002) внесли дополнительную погрешность. Кроме того, общая функция потерь в задаче классификации не могла сохранить порядковую связь между позициями и скоростями, т. е. ошибка предсказания между соседними позициями и ошибка между удаленными позициями были одинаковыми при использовании перекрестной энтропии.

    Размеры вывода (или количество атрибутов) зависели от стратегии декодирования (одновременное или раздельное).

    Одновременное декодирование

    Для стратегии одновременного декодирования свертки и уровни прямой связи были общими для извлечения признаков для кодирования положения и скорости, а разные веса использовались только в последнем слое для предсказания положения и скорости.В этом случае в заголовке регрессии есть 3 метки вывода ( x, y, v ).

    Отдельное декодирование

    Для отдельной стратегии декодирования было два набора сверток и слоев прямой связи, отдельно обученных для прогнозирования положения и скорости. В этом случае один декодер имеет 1 выходную метку ( v ), а другой — 2 выходные метки ( x, y ).

    Сверточная нейронная сеть Vanilla (ConvNet)

    В качестве входных данных модель использовала изображение в градациях серого (одноканальное) и использовала сверточные слои, подключенные к головке регрессии, для декодирования непрерывного поведения.Размер ядра 3 использовался для всех двумерных сверток. Количество фильтров было удвоено для каждого последующего слоя и достигло 512. Для понижающей дискретизации мы использовали шаг 2, чтобы заменить объединенные слои для повышения вычислительной эффективности. После свертки элементы были сглажены и помещены в серию плотных слоев. Количество единиц уменьшалось вдвое для каждого последующего плотного слоя. Чтобы поощрить разреженность сети и ускорить обучение без риска введения умирающих единиц, Leaky-Relu использовалась в качестве функции активации, за исключением последнего слоя.Последний слой был применен с функцией активации Tanh, чтобы выходные значения соответствовали диапазону целевых меток.

    Количество сверточных слоев, количество полносвязных слоев и количество единиц в первом полносвязном слое являются гиперпараметрами. Оцененная на проверочном наборе, выбранная модель, используемая в этом исследовании, имела 8 сверточных слоев и 5 полносвязных слоев (с количеством единиц = [256, 64, 32, 16, 3] соответственно). В нашей задаче добавление пакетной нормализации ухудшило производительность предсказания, поэтому мы не использовали пакетную нормализацию в нашем декодере.

    Остаточная нейронная сеть с 50 слоями (ResNet-50)

    Модель ResNet (He et al., 2016) изначально была разработана для получения входного изображения RGB для задач распознавания объектов, поэтому изображения в градациях серого были преобразованы в изображения RGB, с вычитанием среднего значения на пиксель. Мы сохранили архитектуру извлечения признаков, состоящую из сверточных блоков и блоков идентификации, и заменили архитектуру классификации плотными слоями, функциями активации которых были Leaky-Relu (первые несколько слоев) и Tanh (последний слой).

    Для переносного обучения параметры в архитектуре извлечения признаков были предварительно обучены ImageNet и заморожены во время обучения модели, тогда как параметры в плотных слоях обновляются во время обучения. После этого последние несколько слоев архитектуры извлечения признаков были разморожены и обучены совместно с новыми плотными слоями. Для обучения с нуля все параметры в модели были инициализированы с помощью инициализации Xavier (Glorot and Bengio, 2010).

    Эффективная сверточная сеть для мобильных приложений (MobileNet)

    MobileNet (Howard et al., 2017) был разработан для достижения облегченной архитектуры путем замены сверточного слоя глубинным сверточным слоем, за которым следует точечный сверточный слой, который объединяет эти отфильтрованные значения для создания новых функций. Он использовал шаг 2 для уменьшения пространственных размеров вместо объединения слоев. К этому декодеру применялись те же шаги предварительной обработки, что и в модели ResNet. Точно так же в этом исследовании были выполнены процедуры как трансферного обучения, так и обучения с нуля.

    Нейронная сеть с прямой связью (FFNN)

    Мы создали нейронную сеть с прямой связью для изучения функций непосредственно через плотные соединения. Модель сначала применила максимальное 2D-объединение к каждому изображению в градациях серого для пространственной субдискретизации, а затем сгладила эти функции для серии плотных слоев. Количество блоков, функции активации и процедура поиска гиперпараметров были такими же, как и в ванильной ConvNet.

    Сквозной декодер с видеовходами

    Мы также создали сквозной декодер, который брал короткое видео с размером окна N для прогнозирования поведения центроидов в соответствующие моменты времени.Были разработаны две архитектуры в зависимости от того, распределялись ли сверточные веса во времени.

    Свертки, не зависящие от времени

    Входное измерение расширилось от одного канала до нескольких каналов, каждый из которых соответствует кадру изображения. Архитектура декодера сохранила оригинальную сверточную нейронную сеть с двумерными ядрами. Характеристики из разных кадров были взвешены и объединены после первого слоя. Не было никаких ограничений на сверточные ядра.

    Свертки, общие во времени

    Входное измерение расширено временным измерением для N кадров. Каждый кадр проходил через блок сверточных слоев, веса которых были разделены во времени, создавая характерную для кадра функцию. Эти специфичные для кадра функции были линейно взвешены слоем внимания, а затем интегрированы в окончательный элемент F post перед вводом в плотные слои модели.

    Процедура обучения

    Для обучения модели использовался мини-пакетный градиентный спуск.Для каждой мини-партии из обучающего набора случайным образом выбиралось подмножество входных изображений и выходных меток. Каждое входное изображение имело соответствующие нормализованные выходные метки ( x, y, v ). Размер партии (т. е. количество выборок на шаг) составлял 64, а порядок выборок менялся для каждой эпохи. Поиск гиперпараметров был достигнут путем поиска по сетке для скорости обучения, количества сверточных слоев, количества плотных слоев, количества единиц и отсева. Оптимизация Адама использовалась для ускорения обучения.Веса и смещения ядра инициализируются при инициализации Xavier (Glorot and Bengio, 2010) и обновляются путем обратного распространения потерь L1, т. е. абсолютных разностей между оценочными и целевыми значениями. где y i — истинное значение, — прогнозируемое значение для выборки i, m — размер пакета, а d — размерность выходных данных модели ( d =3 для одновременного декодирования и d =1 для раздельного декодирования).

    Обучение было остановлено, когда количество шагов итерации достигло 50 000 или когда производительность проверки осталась неизменной или увеличилась за 5 эпох.Переменные модели и гиперпараметры обучения сохранялись в контрольной точке каждые 500 шагов итерации. Обучение проводилось на GeForce RTX 2080 Ti с использованием Tensorflow, а для поиска по сетке использовались параллельные вычисления.

    Показатели оценки

    После обучения модели ее производительность оценивалась на тестовом наборе. Учитывая, что выходные данные модели нормализованы, прогнозируемые значения были преобразованы обратно в исходные масштабы в [см] и [см/с]. После этого мы рассчитали евклидово расстояние между каждой наземной истиной и ее предсказанным положением и использовали медиану среди этих ошибок в качестве показателя производительности для декодирования положения.Для скоростного декодирования мы рассчитали абсолютную разницу между каждой наземной истиной и ее предсказанным значением и использовали медианную ошибку в качестве показателя производительности. Для эксперимента или конкретной модели, оцениваемой на нескольких наборах данных, распределение средней ошибки декодирования описывалось как среднее ± стандартная ошибка.

    Расчет уровня вероятности

    Уровень вероятности определялся как производительность декодирования с использованием случайных изображений (см. предыдущий раздел Эксперимент с остаточной информацией).

    5.5 Многообразный анализ

    Чтобы визуализировать представление ансамбля на каждом сетевом уровне в нашем декодере, ансамбли в разные моменты времени были спроецированы в низкоразмерное подпространство.

    Isomap

    Isomap — это алгоритм нелинейного уменьшения размерности для поиска вложений, который поддерживает геодезические расстояния между всеми точками данных. Мы использовали scikit-learn (Pedregosa et al., 2011) для реализации этого алгоритма и извлекли низкоразмерные вложения каждого слоя. Оптимальное количество ближайших соседей ( K opt ) было выбрано путем нахождения колена, при котором кривая ошибки реконструкции (ER) переставала значительно уменьшаться с большим количеством ближайших соседей.где N — количество выборок, D x и D y соответствуют тем же определениям, что и выше, а K — это ядро ​​Isomap.

    Метрики подобия многообразия

    Для измерения геометрического сходства между многообразием и поведенческой топологией, сформированной положением, мы вычислили корреляцию Пирсона между попарными расстояниями в двумерных координатах многообразия и поведенческих координатах (Low et al., 2018), которая использовалась в качестве метрики для оценки обучения на разных сетевых уровнях.

    5.6 Карта заметности сети

    Чтобы лучше интерпретировать, как сеть кодировщика делает прогнозы, мы использовали карту значимости, чтобы указать пиксели, изменения которых оказывают наибольшее влияние на прогноз. Вместо того, чтобы напрямую распространять выходной градиент на вход (Simonyan et al., 2013), мы модифицировали метод карты активации классов с взвешенным градиентом (Grad-CAM) (Selvaraju et al., 2017), чтобы создать более гладкую карту заметности.

    Grad-CAM изначально предназначен для обратного распространения градиентов оценки целевого класса y c на последний сверточный слой, карты признаков которого сохраняют пространственную информацию, и создания локализованной карты значимости L c для класса c, с помощью взвешенной комбинации карт активации A k с последующей операцией ReLU, как в уравнении (4).

    Мы модифицировали Grad-CAM, поскольку в нашем исследовании использовалась задача непрерывной регрессии. Мы визуализировали значимость входных данных, которые либо увеличивали, либо уменьшали выходные данные, вычисляя абсолютные градиенты. Мы также адаптировали этот алгоритм для визуализации карт значимости различных фильтров в модели сети путем вычисления градиентов от фильтра на определенном слое по отношению к ближайшему сверточному слою, чьи карты признаков имели достаточно большое пространственное разрешение.

    5.7 Статистический анализ

    Статистический анализ проводили с использованием SciPy (Virtanen et al., 2020). Все значения были представлены как среднее ± стандартное отклонение. если не указано другое. Критерии знакового ранга Уилкоксона использовались, когда парные выборки не были распределены нормально. Для случаев, соответствующих требованию нормальности, использовался критерий Стьюдента. Поправка Бонферрони использовалась для множественных сравнений. Для получения корреляций использовалась корреляция Пирсона.

    Список литературы

    1. Х .Глорот и Ю. Бенжио. Понимание сложности обучения нейронных сетей с глубокой прямой связью. В разбирательстве тринадцатой международной конференции по искусственному интеллекту и статистике, страницам 249-256, 2010. 39, 40

    2. K. Он, х Чжан, С. Рен и Дж. Сун. Глубокое остаточное обучение для распознавания изображений. В материалах конференции IEEE по компьютерному зрению и распознаванию образов, стр. 770–778, 2016 г.39

    3. R.Р. Сельвараджу, М. Когсуэлл, А. Дас, Р. Ведантам, Д. Парих и Д. Батра. Grad-cam: Визуальные объяснения из глубоких сетей с помощью локализации на основе градиента. В разбирательстве международной конференции IEEE на компьютерное зрение, страницы 618-626, 2017. 10, 16, 41

    4. М .Д. Цайлер и Р. Фергус. Визуализация и понимание сверточных сетей. На Европейской конференции по компьютерному зрению, стр. 818–833. Springer, 2014. 16

    Irjet — Запрошенная вами страница не была найдена на нашем сайте

    IRJET приглашает бумагу из различных инженерных и технологий, научных дисциплин для объема 9 Выпуск 3 (март 2022 г.)

    Отправить сейчас


    IRJET Vol-9 Выпуск 3, март 2022 г. Публикация находится в процессе…

    Browse Papers


    IRJET Получил «Импакт-фактор научного журнала: 7,529» за 2020 год.

    Подтвердить здесь


    IRJET приглашает к публикации том 9, выпуск 3, выпуск 3 (март 2022 г.) из различных инженерных и технологических дисциплин (март 2022 г.)

    Отправить сейчас..

    Browse Papers


    IRJET Получил «Импакт-фактор научного журнала: 7,529» за 2020 год.

    Подтвердить здесь


    IRJET приглашает к публикации том 9, выпуск 3, выпуск 3 (март 2022 г.) из различных инженерных и технологических дисциплин (март 2022 г.)

    Отправить сейчас..

    Browse Papers


    IRJET Получил «Импакт-фактор научного журнала: 7,529» за 2020 год.

    Подтвердить здесь


    IRJET приглашает к публикации том 9, выпуск 3, выпуск 3 (март 2022 г.) из различных инженерных и технологических дисциплин (март 2022 г.)

    Отправить сейчас..

    Browse Papers


    IRJET Получил «Импакт-фактор научного журнала: 7,529» за 2020 год.

    Подтвердить здесь


    IRJET приглашает к публикации том 9, выпуск 3, выпуск 3 (март 2022 г.) из различных инженерных и технологических дисциплин (март 2022 г.)

    Отправить сейчас..

    Browse Papers


    IRJET Получил «Импакт-фактор научного журнала: 7,529» за 2020 год.

    Подтвердить здесь


    IRJET приглашает к публикации том 9, выпуск 3, выпуск 3 (март 2022 г.) из различных инженерных и технологических дисциплин (март 2022 г.

    Добавить комментарий

    Ваш адрес email не будет опубликован.

    Адрес: г. Чайковский, Пермский край ул. Промышленная 8/8,
    Телефоны: 8 34241 2-10-80 [email protected]
    © «Феникс», 2019
    Оценка Drugbank ID Drugbank ID Наркомание на наркотики Увеличение литературы
    1 0,931 дБ00541 Винкристин [59–61]
    2 0.924 DB00399 Zoledronate [62] [62]
    3 0,902 9 Cytarabine [63] [63]
    4
    4 DB00884 Rizedronate [64]
    5 0.893 DB01073 NA Na
    6 0,889 DB00755 Tretinoin [65]
    7
    DB00762 Irinotecan [66] [66]
    DB00630 Alendronate [67] [67]
    9
    9 DB01005 Гидроксиуреа [68]
    10 0,878 DB01196 Эстрамустин Н.А.

    Выводы и обсуждения

    Выявление потенциальных ассоциаций лекарств и заболеваний является важным шагом в разработке лекарств, но выявление их с помощью влажных экспериментов требует больших затрат времени и средств. Наряду с накоплением мультиомных данных о лекарствах и заболеваниях, а также с развитием методов машинного обучения предлагается все больше и больше вычислительных методов для прогнозирования потенциальных ассоциаций лекарств и заболеваний. Чтобы помочь в прогнозировании, многие методы объединяют несколько источников данных, включая лекарства, болезни, мишени, побочные эффекты и т. д.Они добились хороших результатов и могут предоставить полезную информацию о разработке лекарств. Большинству из них требуется сходство данных о наркотиках и заболеваниях. Однако данные о сходстве не так просто получить, и людям часто приходится настраивать программу для обхода данных и вычисления сходства, чтобы удовлетворить свои собственные потребности. Хуже того, некоторые функции, необходимые для расчета сходства, неизвестны или недоступны. Эти методы не будут работать при наличии неполных данных. Кроме того, из-за отсутствия проверенных отрицательных образцов при прогнозировании ассоциаций лекарств и болезней большинство методов, основанных на машинном обучении, предполагают, что немаркированные образцы являются отрицательными при обучении модели.Такая стратегия может привести к ошибкам, поскольку в немеченых образцах могут быть обнаружены положительные образцы. Более того, большинство существующих методов используют множество параметров при интеграции данных и построении модели. Параметры сложно настроить, что ограничивает обобщающую способность метода.

    В этой работе мы предложили метод, названный EMP-SVD, для прогнозирования взаимодействий лекарств и болезней на основе ансамблевых метапутей и разложения по сингулярным числам. Пять метамаршрутов от исходного узла (лекарство) к конечному узлу (болезнь) были выбраны для интеграции информации о взаимодействии лекарств, белков и заболеваний.Затем рассчитывались коммутирующие матрицы этих метапутей, каждый элемент которых указывает количество экземпляров пути между соответствующей парой лекарство-болезнь. Используя разложение по сингулярным числам на коммутирующих матрицах, мы можем извлечь небольшое количество скрытых признаков лекарств и болезней. Чтобы получить надежные отрицательные образцы, мы выбрали эти немеченые образцы как отрицательные, исходя из предположения, что если лекарство и болезнь не имеют общих белков, то вероятность того, что они связаны с лечением, меньше.На основе каждого метапути мы сначала построили базовый классификатор, а затем объединили их, чтобы получить групповой классификатор. Результаты экспериментов показали, что предложенный нами метод EMP-SVD превзошел несколько современных методов. Лучше, чем другие методы, EMP-SVD имеет мало параметров и очень прост в настройке. Более того, тематические исследования показали, что предсказанные новые ассоциации могут быть полезны для дальнейших биомедицинских исследований, которые демонстрируют практичность нашего метода.

    Несмотря на то, что в социальных сетях и некоторых других сетях существуют методы, основанные на метапутях, насколько нам известно, это первая работа по прогнозированию ассоциаций наркотиков и болезней с использованием ансамблевых метапутей и разложения по сингулярным числам.В отличие от многих существующих методов, нам не нужны данные о сходстве, которые нелегко получить, а иногда они недоступны или неизвестны. Вместо этого мы просто используем данные взаимодействия, к которым можно легко получить доступ во многих базах данных, для построения модели прогнозирования. Другим преимуществом метода является то, что есть только один параметр, который можно легко установить. Хотя мы используем стратегию ансамбля для повышения производительности, каждый из пяти базовых классификаторов может независимо выступать в качестве модели, а также для прогнозирования взаимодействия лекарства и болезни.Поскольку существует множество вычислительных методов для прогнозирования белков-мишеней для нового лекарства, таких как методы докинга. Для нового препарата, который не имеет известных взаимодействий с какими-либо заболеваниями, мы все же можем предсказать его взаимодействующие заболевания, построив классификатор с использованием мета-пути-2, используя взаимодействия лекарство-белок и белок-заболевание.

    Хотя результаты наших методов многообещающие, все же есть некоторые ограничения. Во-первых, мы используем только информацию о лекарствах, белках и заболеваниях, есть много другой информации, которая также может быть интегрирована в дальнейшую работу, например, информация о побочных эффектах, путях, тканях и так далее.Во-вторых, мы используем только обычные белки для отбора отрицательных образцов, для этой цели также может использоваться некоторая другая информация, такая как данные об экспрессии генов. Или мы можем напрямую построить модель с помощью метода обучения на основе положительных и немаркированных образцов. Мы рассмотрим эти вопросы в будущем исследовании.

    Благодарности

    Авторы благодарят редакторов и анонимных рецензентов за их полезные комментарии и предложения по улучшению качества нашей настоящей статьи.

    Финансирование

    Публикация этой статьи спонсировалась грантом Национального научного фонда Китая [61272274, 60970063]; программа для выдающихся талантов нового века в университетах [NCET-10-0644]; и Национальный научный фонд провинции Цзянсу [BK20161249].

    Наличие данных и материалов

    Данные, подтверждающие результаты этого исследования, включены в эту статью.

    сокращения

    901 19
    ACC Точность
    AUC площадь под кривой ROC
    AUPR площадь под давлением кривой
    FN FALE USTHO
    918
    ложный положительный
    FPR FPR FPR MCC MCC Omim онлайн Mendelian наследство в Man
    Pre Precision
    Rec Recall
    ROC ROC ROC ROC Reciver Операционная характеристика
    Упрощенная молекулярная входная линия входной спецификации

    SVD
    SVM Поддержка векторная машина
    TN TN TN TN TP TP TP TPR TPR 9124 UMLS Unified Medical Language

    Авторов

    GW, JL и XY разработали методологию.GW и XY проводили эксперименты, JL обеспечивал руководство и наблюдение. JL и GW написали эту статью. Все авторы прочитали и одобрили окончательный вариант рукописи.

    Примечания

    Одобрение этических норм и согласие на участие

    Неприменимо.

    Согласие на публикацию

    Не применимо.

    Конкурирующие интересы

    Авторы заявляют об отсутствии конкурирующих интересов.

    Информация об авторе

    Гуаншэн Ву, Электронная почта: [email protected]

    Хуан Лю, электронная почта: [email protected]

    Сян Юэ, электронная почта: [email protected]

    Литература

    1. Адамс С.П., Брантнер В.В. Оценка стоимости разработки нового лекарства: действительно ли это 802 миллиона? Здоровье Афф. 2006;25(2):420–8. [PubMed] [Google Scholar]

    2. Wu G, Liu J, Wang C. Алгоритм разрезания графа с частичным наблюдением для репозиционирования лекарств путем интеграции лекарств, болезней и геномных ассоциаций. Опубликовано: Международная конференция IEEE по биоинформатике и биомедицине (BIBM), 2016 г.Институт инженеров по электротехнике и электронике: 2016. с. 223–228.

    3. Wishart DS, Feunang YD, Guo AC, et al. Drugbank 5.0: крупное обновление базы данных Drugbank за 2018 год. Nucleic Acids Res. 2017;46(Д1):1074–82. [Бесплатная статья PMC] [PubMed] [Google Scholar]4. Боденрейдер О. Единая медицинская языковая система (UMLS): интеграция биомедицинской терминологии. Нуклеиновые Кислоты Res. 2004; 32 (приложение_1): 267–70. [Бесплатная статья PMC] [PubMed] [Google Scholar]5. Хёрле М., Ян Л., Се К. и др. Вычислительное репозиционирование лекарств: от данных к терапии.Клин Фармакол Тер. 2013;93(4):335–41. [PubMed] [Google Scholar]6. Варотаи С., Бергфельд В.Ф. Андрогенная алопеция: доказательная база лечения. Am J Clin Дерматол. 2014;15(3):217–30. [PubMed] [Google Scholar]7. Новак Н. Проблемы и возможности репозиционирования лекарств. Trends Pharmacol Sci. 2013;34(5):267–72. [PubMed] [Google Scholar]8. Сирота М., Дадли Дж.Т., Ким Дж. и др. Открытие и доклиническая проверка показаний к применению с использованием сборников общедоступных данных об экспрессии генов. Sci Transl Med.2011;3(96):96ra77. [Бесплатная статья PMC] [PubMed] [Google Scholar]9. Джахчан Н.С., Дадли Дж.Т., Мазур П.К. и др. Подход к репозиционированию лекарств идентифицирует трициклические антидепрессанты как ингибиторы мелкоклеточного рака легкого и других нейроэндокринных опухолей. Рак Дисков. 2013;3(12):1364–77. [Бесплатная статья PMC] [PubMed] [Google Scholar]10. Пейвандипур А., Сабериан Н., Шафи А. и др. Новый вычислительный подход к перепрофилированию лекарств с использованием системной биологии. Биоинформатика. 2018;34(16):2817–2825. [Бесплатная статья PMC] [PubMed] [Google Scholar]11.Готлиб А., Штейн Г.Ю., Руппин Э. и др. Predict: метод определения показаний к новым лекарствам в применении к персонализированной медицине. Мол Сист Биол. 2011;7(1):496. [Бесплатная статья PMC] [PubMed] [Google Scholar]12. Ван В., Ян С., Чжан С. и др. Репозиционирование лекарств путем интеграции целевой информации через гетерогенную сетевую модель. Биоинформатика. 2014;30(20):2923–30. [Бесплатная статья PMC] [PubMed] [Google Scholar]13. Луо Х., Ван Дж., Ли М. и др. Репозиционирование лекарств на основе комплексных мер подобия и алгоритма двойного случайного блуждания.Биоинформатика. 2016;32(17):2664–2671. [PubMed] [Google Scholar] 14. Мартинес В., Наварро С., Кано С. и др. Drugnet: сетевая приоритизация наркотиков и болезней путем интеграции разнородных данных. Артиф Интелл Мед. 2015;63(1):41–9. [PubMed] [Google Scholar] 15. Ву Г., Лю Дж., Ван С. Прогнозирование взаимодействий лекарств и болезней с помощью полуконтролируемого алгоритма разрезания графа и трехуровневой интеграции данных. БМС Мед Жене. 2017;10(5):79. [Бесплатная статья PMC] [PubMed] [Google Scholar]16. Могадам Х., Рахгозар М., Гарагани С.Оценка нескольких признаков для прогнозирования ассоциаций лекарственного заболевания с использованием слияния и агрегирования информации. SAR QSAR Environ Res. 2016;27(8):609–28. [PubMed] [Google Scholar] 17. Лян Х, Чжан П, Ян Л и др. Lrssl: предсказывать и интерпретировать ассоциации лекарств и болезней на основе интеграции данных с использованием разреженного подпространственного обучения. Биоинформатика (Оксфорд, Англия) 2017;33(8):1187–1196. [PubMed] [Google Scholar] 18. Чжан В., Юэ С., Лю Ф. и др. Единая структура прогнозирования побочных эффектов лекарств с использованием линейного подобия соседей.BMC Сист Биол. 2017;11(6):101. [Бесплатная статья PMC] [PubMed] [Google Scholar]19. Чжан В., Юэ С., Хуан Ф. и др. Прогнозирование ассоциаций «лекарство-заболевание» и их терапевтической функции на основе двусторонней сети связи «лекарство-заболевание». Методы. 2018;145:51–59. [PubMed] [Google Scholar] 20. Чжан В., Юэ С., Линь В. и др. Прогнозирование связи между наркотиками и болезнями с помощью матричной факторизации с ограничениями по сходству. БМК Биоинформа. 2018;19(1):233. [Бесплатная статья PMC] [PubMed] [Google Scholar]

    21. Zhang W, Yue X, Chen Y, et al.Прогнозирование ассоциаций лекарств и болезней на основе известной двудольной сети ассоциаций. Опубликовано: Международная конференция IEEE по биоинформатике и биомедицине (BIBM), 2017 г. Институт инженеров по электротехнике и электронике: 2017. с. 503–9.

    22. Нокс С., Лоу В., Джуисон Т. и др. Drugbank 3.0: всеобъемлющий ресурс для «омных» исследований наркотиков. Нуклеиновые Кислоты Res. 2011;39(доп.1):1035–41. [Бесплатная статья PMC] [PubMed] [Google Scholar]24. Хамош А., Скотт А.Ф., Амбергер Дж.С. и др. Онлайн менделевское наследование у человека (омим), база знаний о генах человека и генетических нарушениях.Нуклеиновые Кислоты Res. 2005; 33 (дополнение 1): 514–7. [Бесплатная статья PMC] [PubMed] [Google Scholar]25. Вейнингер Д. Смайлс, химический язык и информационная система. 1. введение в методологию и правила кодирования. J Chem Inf Comput Sci. 1988;28(1):31–6. [Google Академия] 28. Ван Дриэль М.А., Брюггеман Дж., Вринд Г. и др. Текстовый анализ человеческого феномена. Eur J Hum Genet. 2006;14(5):535–42. [PubMed] [Google Scholar] 29. Sun Y, Han J, Yan X и др. Pathsim : поиск сходства на основе мета-путей в гетерогенных информационных сетях.Proc VLDB Endowment. 2011;4(11):992–1003. [Google Академия] 30. Ву Г., Лю Дж., Мин В. Прогнозирование взаимосвязи лечения лекарствами и заболеваниями на основе положительных и немеченых образцов. J Intell Fuzzy Syst. 2018;35(2):1363–73. [Google Академия] 31. Педрегоса Ф., Вароко Г., Грамфорт А. и др. Scikit-learn: Машинное обучение в Python. Дж. Мах Узнать Рез. 2011; 12 (октябрь): 2825–30. [Google Академия] 32. Гуань Д., Юань В., Ли Ю.К. и др. Обзор выбора функций на основе ансамблевого обучения. Iete Tech Rev. 2014;31(3):190–8. [Google Scholar]

    33.Чжан В., Ши Дж., Танг Г., Ву В, Юэ X, Ли Д. Прогнозирование малых РНК в бактериях с помощью метода ансамбля обучения последовательности. Опубликовано: Международная конференция IEEE по биоинформатике и биомедицине (BIBM), 2017 г. Институт инженеров по электротехнике и электронике: 2017. с. 643–7.

    34. Keczkes K, Frain-Bell W, Honeyman A, Sprunt G. Влияние на функцию надпочечников лечения экземы и псориаза триамцинолона ацетонидом. Бр Дж Дерматол. 1967; 79 (8–9): 475–86. [PubMed] [Google Scholar] 35. Шмид С., Пилетта П.А., Сорат Дж.Х.Лечение экземы смесью триамцинолона ацетонида и ретиноевой кислоты двойное слепое исследование. Дерматология. 1993;187(4):263–7. [PubMed] [Google Scholar] 36. Гранлунд Х., Эркко П., Эрикссон Э., Рейтамо С. Сравнение циклоспорина и местного бетаметазона-17, 21-дипропионата при лечении тяжелой хронической экземы рук. Акта Дерм Венерол. 1996;76(5):371-6. [PubMed] [Google Scholar] 37. Вермеер Б., Хереманс Г. Случай задержки роста и синдрома Кушинга из-за чрезмерного применения мази бетаметазон-17-валерат.Дерматология. 1974;149(5):299–304. [PubMed] [Google Scholar] 38. Sillanpää M, Pihlaja T. Окскарбазепин (gp 47 680) в лечении трудноизлечимых припадков. Acta Pediatr Hung. 1988;29(3-4):359–64. [PubMed] [Google Scholar] 39. Вирди СК, Канвар А.С. Генерализованный морфеоз, склерозирующий и атрофический лихен, ассоциированный с подслизистым фиброзом полости рта у взрослого мужчины. Indian J Dermatol Venereol Лепрология. 2009;75(1):56. [PubMed] [Google Scholar]40. Виллемзе Р., Питерс В., Ван Хенник М. и др. Промежуточные и высокие дозы ara-c и m-amsa (или даунорубицина) в качестве лечения ремиссии и консолидации у пациентов с рецидивом острого лейкоза и лимфобластной неходжкинской лимфомой.Scand J Haematol. 1985;34(1):83–7. [PubMed] [Google Scholar]41. Ричардсон Д.С., Келси С.М., Джонсон С.А. и соавт. Ранняя оценка липосомального даунорубицина (дауноксом , некстар) при лечении рецидивирующей и рефрактерной лимфомы. Исследуйте новые наркотики. 1997;15(3):247–53. [PubMed] [Google Scholar]42. Gustafson MP, Lin Y, New KC, et al. Системная иммуносупрессия при глиобластоме: взаимодействие между моноцитами cd14+ hla-drlo/neg, опухолевыми факторами и дексаметазоном. Нейро-Онкол. 2010;12(7):631–44.[Бесплатная статья PMC] [PubMed] [Google Scholar]43. Hultén K, Jaup B, Stenquist B, Engstrand L. Комбинированное лечение ранитидином высокоэффективно против Helicobacter pylori, несмотря на негативное влияние резистентности к макролидам. Хеликобактер. 1997;2(4):188–93. [PubMed] [Google Scholar]44. Гринбаум-Лефко Б., Розенсток Дж. Г., Беласко Дж. Б. и др. Синдром неадекватной секреции антидиуретического гормона. осложнение внутривенного введения высоких доз мелфалана. Рак. 1985;55(1):44–6. [PubMed] [Google Scholar]45.Winick NJ, McKenna RW, Shuster JJ, et al. Вторичный острый миелоидный лейкоз у детей с острым лимфобластным лейкозом, получавших лечение этопозидом. Дж. Клин Онкол. 1993;11(2):209–17. [PubMed] [Google Scholar]46. Маркс Д.И., Форман С.Дж., Блюм К.Г. и др. Сравнение циклофосфамида и облучения всего тела с этопозидом и облучения всего тела в качестве режимов кондиционирования для пациентов, перенесших аллотрансплантацию братьев и сестер по поводу острого лимфобластного лейкоза в первой или второй полной ремиссии. Трансплантация костного мозга Биол.2006;12(4):438–53. [PubMed] [Google Scholar]47. Christiaens G, Nieuwenhuis H, von Dem Borne AK, et al. Идиопатическая тромбоцитопеническая пурпура при беременности: рандомизированное исследование влияния антенатальных низких доз кортикостероидов на количество тромбоцитов у новорожденных. BJOG: Int J Obstet Gynaecol. 1990;97(10):893–8. [PubMed] [Google Scholar]48. Ратайн М., Роули Дж. Острый миелоидный лейкоз, связанный с терапией, вторичный по отношению к ингибиторам топоизомеразы ii: от прикроватных к генам-мишеням. Энн Онкол. 1992;3(2):107–11.[PubMed] [Google Scholar]49. Ривера Г.К., Пуи С.Х., Абромович М. и др. Улучшение исхода острого лимфобластного лейкоза у детей благодаря усиленному раннему лечению и ротационной комбинированной химиотерапии. Ланцет. 1991;337(8733):61–6. [PubMed] [Google Scholar]50. Камп О, Сиесверда ГТ, Виссер СА. Сравнение влияния небиволола и атенолола на систолическую и диастолическую функцию левого желудочка у пациентов с неосложненной эссенциальной гипертензией. Ам Джей Кардиол. 2003;92(3):344–8. [PubMed] [Google Scholar]51.Уильямс Б., Макдональд ТМ, Морант С. и др. Спиронолактон в сравнении с плацебо, бисопрололом и доксазозином для определения оптимального лечения лекарственно-устойчивой гипертензии (путь-2): рандомизированное двойное слепое перекрестное исследование. Ланцет. 2015;386(10008):2059–68. [Бесплатная статья PMC] [PubMed] [Google Scholar]52. Аллен Р.П., Бхармал М., Кэллоуэй М. Распространенность и бремя болезни первичного синдрома беспокойных ног: результаты общего обследования населения в Соединенных Штатах. Мов Беспорядок. 2011;26(1):114–20. [PubMed] [Google Scholar]53.Баррикман Л.Л., Перри П.Дж., Аллен А. и др. Бупропион против метилфенидата в лечении синдрома дефицита внимания с гиперактивностью. J Am Acad Детская подростковая психиатрия. 1995;34(5):649–57. [PubMed] [Google Scholar]55. Джеякумар А., Брикман Т.М., Хабен М. Эффективность амитриптилина по сравнению с препаратами, подавляющими кашель, при лечении хронического кашля, вызванного поствирусной блуждающей невропатией. Ларингоскоп. 2006;116(12):2108–12. [PubMed] [Google Scholar]56. Ди Лоренцо К., Амброзини А., Коппола Г., Пьерелли Ф.Расстройства теплового стресса и головная боль: случай новой ежедневной постоянной головной боли, вторичной по отношению к тепловому удару. J Neurol Нейрохирург Психиатрия. 2008;79(5):610–1. [PubMed] [Google Scholar]57. Гавин Ф.Х., Марков Р.А. Паническая тревога после резкого прекращения приема амитриптилина. Am J Психиатрия. 1981;138(1):117–118. [PubMed] [Google Scholar]58. Бекман Т.Дж., Майндерс Л.А. Оценка и медикаментозное лечение доброкачественной гиперплазии предстательной железы. В: Материалы клиники Мэйо, том. 80. Elsevier Inc.: 2005. с. 1356–62. [Пубмед] 59.Кэссиди Дж., Меррик М.В., Смит Дж.Ф., Леонард Р.С. Кардиотоксичность митозантрона оценивали с помощью ядерной вентрикулографии в состоянии стресса и покоя. Евр Джей Рак. 1988;24(5):935–8. [PubMed] [Google Scholar] 60. Yap H-Y, Blumenschein GR, Tashima CK, et al. Комбинированная химиотерапия винкристином и метотрексатом при распространенном рефрактерном раке молочной железы. Рак. 1979;44(1):32–4. [PubMed] [Google Scholar]61. Холланд Дж. Ф., Шарлау С., Гайлани С. и др. Лечение винкристином распространенного рака: совместное исследование 392 случаев.Рак Рез. 1973; 33 (6): 1258–64. [PubMed] [Google Scholar]62. Гнант М., Млинерич Б., Шиппингер В. и соавт. Эндокринная терапия плюс золедроновая кислота при пременопаузальном раке молочной железы. N Engl J Med. 2009;360(7):679–91. [PubMed] [Google Scholar]63. Мего М., Сыкова-Мила З., Обертова Дж. и соавт. Интратекальное введение трастузумаба с цитарабином и метотрексатом у больных раком молочной железы с лептоменингеальным карциноматозом. Грудь. 2011;20(5):478–80. [PubMed] [Google Scholar]65. Fenner MH, Elstner E. Лиганды рецептора, активируемого пролифератором пероксисом, — γ для лечения рака молочной железы.Мнение эксперта по расследованию наркотиков. 2005;14(6):557–68. [PubMed] [Google Scholar]66. Ma CX, Ellis MJ, Petroni GR и др. Исследование II фазы ucn-01 в комбинации с иринотеканом у пациентов с метастатическим тройным негативным раком молочной железы. Лечение рака молочной железы. 2013;137(2):483–92. [Бесплатная статья PMC] [PubMed] [Google Scholar]67. Thamake SI, Raut SL, Gryczynski Z, et al. Наночастицы полимолочной и гликолевой кислот (plga), покрытые алендронатом, для активного нацеливания на метастатический рак молочной железы. Биоматериалы. 2012;33(29):7164–73.[PubMed] [Google Scholar]68. Vaughan W, Reed E, Edwards B, Kessinger A. Высокие дозы циклофосфамида, тиотепа и гидроксимочевины со спасением аутологичных гемопоэтических стволовых клеток: эффективный режим химиотерапии консолидации для раннего метастатического рака молочной железы. Пересадка костного мозга. 1994;13(5):619–24. [PubMed] [Google Scholar]

    Новый и эффективный подход к декодированию фМРТ, основанный на срезах обратной регрессии и его применении для предсказания болии доктор философии получил степень на факультете электротехники и электронной инженерии Гонконгского университета, Китай, в 2012 и 2016 годах соответственно. Сейчас он научный сотрудник Массачусетской больницы общего профиля и Гарвардской медицинской школы, а также приглашенный научный сотрудник Шэньчжэньского университета. Его исследовательские интересы включают биомедицинскую обработку сигналов, статистическое машинное обучение и нейронную инженерию.

    Зенин Фу получил докторскую степень. степень на факультете электротехники и электронной инженерии Гонконгского университета, Китай, в 2016 году.В настоящее время он является постдокторантом в сети исследований разума, Альбукерке, Северо-Запад, США. Его исследовательские интересы включают обработку биомедицинских сигналов и машинное обучение.

    Ао Тан получил B.S. степень в области автоматизации Университета Сунь Ятсена в 2012 году. Он получил докторскую степень. получил степень на факультете электротехники и электронной инженерии Гонконгского университета в 2017 году. Его исследовательские интересы включают обработку биомедицинских сигналов и статистическое машинное обучение.

    Ган Хуанг получил степень бакалавра и магистра на факультете математики Юго-восточного университета Китая в 2005 и 2008 годах соответственно.Он получил докторскую степень. получил степень в Шанхайском университете Цзяо Тонг, Китай, в 2013 году. С 2013 по 2016 год он был научным сотрудником Института неврологии Католического университета Лувена, Бельгия. В настоящее время он является доцентом Шэньчжэньского университета в Китае. Его исследовательские интересы включают обработку биомедицинских сигналов, интерфейс мозг-компьютер и нейропротезирование.

    Ли Ху получил степень бакалавра инженерных наук и магистра наук в Тяньцзиньском университете, Китай, в 2005 и 2007 годах соответственно.Он получил докторскую степень. получил степень в Университете Гонконга в 2010 году. С 2010 по 2011 год он был приглашенным научным сотрудником в Университетском колледже Лондона. Он работал в Юго-Западном университете Китая с 2011 по 2016 год, а затем поступил в Институт психологии Китайской академии наук, где в настоящее время является профессором. Его исследовательские интересы включают обработку биомедицинских сигналов, нейронную инженерию и неврологию боли.

    YS Hung получил степень бакалавра наук. (Eng) в области электротехники и B.наук по математике, как из Университета Гонконга, так и M.Phil. и доктор философии степени Кембриджского университета. Он работал в Кембриджском университете и Университете Суррея в Великобритании, прежде чем он присоединился к Университету Гонконга, где в настоящее время является профессором кафедры электротехники и электронной инженерии. Его исследовательские интересы включают биомедицинскую инженерию, компьютерное зрение и системы управления.

    Zhiguo Zhang получил докторскую степень. степень на факультете электротехники и электронной инженерии Гонконгского университета в 2008 году.Он был доцентом-исследователем в Гонконгском университете с 2012 по 2014 год и доцентом в Наньянском технологическом университете с 2015 по 2016 год. Китай. Его исследовательские интересы включают обработку биомедицинских сигналов, анализ медицинских изображений, нейронную инженерию и вычислительную нейронауку.

    © 2017 Elsevier B.V. Все права защищены.

    Границы | Декодирование кинематической информации из деятельности ансамбля первичной моторной коры с использованием глубокого канонического корреляционного анализа

    Введение

    Первичная моторная кора (М1) прочно связана с кинематическими параметрами верхних конечностей (Хамфри, 1972; Хамфри и Корри, 1978; Георгопулос и др., 1982, 1986; Серджио и др., 2005 г.; Шварц, 2007; Аггарвал и др., 2008 г.; Варгас-Ирвин и др., 2010). Эта концепция обеспечивает основу для декодирования информации во внутрикортикальном интерфейсе мозг-машина (BMI), который часто использует активность M1 для определения параметров непрерывного движения, чтобы обеспечить нейронный контроль над внешними эффекторами. Внутрикортикальные ИМТ в значительной степени основывались на функциональных взаимосвязях между активностью M1 и кинематикой (Moran and Schwartz, 1999b; Paninski et al., 2003; Wu et al., 2004; Шанечи и др., 2016; Васьков и др., 2018). Например, ряд ИМТ был разработан на основе открытия, что вектор популяции, построенный на основе импульсной активности ансамбля нейронов, может предсказывать кинематические переменные движений рук, такие как направление, скорость, положение и скорость (Georgopoulos et al. ., 1986, 1988; Flament and Hore, 1988; Schwartz et al., 1988; Moran and Schwartz, 1999b; Paninski et al., 2003; Wang et al., 2007). Было продемонстрировано, что в дополнение к вектору популяции нейронные репрезентации, отражающие общую изменчивость нейронной активности популяции, эффективны для прогнозирования поведенческих ковариат (Yu et al., 2009; Шеной и др., 2013; Каннингем и Ю, 2014 г.; Као и др., 2015). Эти нейронные представления можно получить с помощью методов обучения без учителя, таких как анализ основных компонентов (PCA) (Ames et al., 2014; Kaufman et al., 2014), факторный анализ (FA) (Yu et al., 2009) и линейная динамическая система (LDS) на основе оценки латентного состояния (Kao et al., 2015) и, как известно, позволяет декодеру гарантировать стабильные выходные данные (Yu et al., 2009; Kao et al., 2013). Такие нейронные представления активности нейронной популяции могут помочь улучшить декодирование кинематических переменных.Модели декодирования для интракортикальных ИМТ можно разделить на две категории. Первая категория представляет собой генеративный метод, который работает на основе генерации активаций нейронов из кинематических состояний, описанных моделями кодирования. Вторая категория представляет собой прямой метод, который работает на основе прямой аппроксимации функции ввода-вывода от возбуждения нейронов к кинематическим переменным (Chapin et al., 1999; Sussillo et al., 2012; Dethier et al., 2013; Ahmadi et al. ., 2019).

    Методы генеративного декодирования, разработанные для ИМТ, включают алгоритм популяционного вектора (Georgopoulos et al., 1986; Шварц и Моран, 2000 г.; Van Hemmen and Schwartz, 2008), фильтр Калмана (KF) (Wu et al., 2004, 2006; Gilja et al., 2012; Golub et al., 2014), точечный адаптивный фильтр на основе процесса (Wang et al. ., 2009; Shanechi et al., 2014) и фильтр частиц (Gao et al., 2001), и это лишь некоторые из них. Эти методы выводят кинематическую информацию из наблюдаемой активности нейронов с помощью моделей кодирования. Таким образом, производительность методов генеративного декодирования существенно зависит от допущений и пригодности моделей кодирования.Кроме того, методы прямого декодирования, разработанные для ИМТ, включают фильтр Винера (Chapin et al., 1999; Serruya et al., 2002; Fagg et al., 2009; Chhatbar and Francis, 2013; Willett et al., 2013), опорный вектор регрессия (Kim et al., 2006; Xu et al., 2011) и искусственные нейронные сети (ANN) (Wessberg et al., 2000; Sanchez et al., 2003). В частности, ANN могут служить прямым приближением нелинейной функциональной связи между действиями M1 и кинематическими переменными. Для декодирования активности M1 были предложены различные типы ИНС, в том числе нейронные сети с временной задержкой (Kim et al., 2003; Wang et al., 2005), рекуррентная нейронная сеть (RNN) (Sussillo et al., 2012) и сеть эхо-состояний (Rao et al., 2005). Кроме того, благодаря недавним прорывам в области глубокого обучения использование глубоких нейронных сетей (ГНС) для декодирования активности M1 стало вероятным (Sussillo et al., 2012; Ahmadi et al., 2019). Например, RNN с долговременной кратковременной памятью (LSTM-RNN), одна из нелинейных моделей, использующих временную информацию о прошлых нейронных действиях, превзошла другие модели декодирования для ИМТ (Ahmadi et al., 2019). Несмотря на их высокую производительность, сложные архитектуры DNN часто требуют гораздо больших обучающих данных для достижения успешного процесса декодирования. Кроме того, недавние попытки записать большее количество нейронных активностей (например,> 1000 единиц) требуют эффективных репрезентативных пространств активности нейронных ансамблей, что также уменьшит нагрузку на обучение DNN (Marblestone et al., 2013).

    Учитывая преимущество DNN как универсального нелинейного аппроксиматора, в настоящем исследовании мы предлагаем новый подход к декодированию M1-активностей для оценки кинематики конечностей путем изучения совместного репрезентативного пространства между M1-активностями и кинематикой.В этом совместном пространстве переменные представления нейронного ансамбля и кинематические параметры создаются таким образом, чтобы максимизировать связь между нейронными и кинематическими переменными представления. Среди многих способов сделать это мы использовали такие методы, как канонический корреляционный анализ (CCA), чтобы максимизировать корреляции между этими переменными. Как один из многомерных статистических методов, CCA максимизирует корреляции между совместными (каноническими) переменными. Обычный линейный канонический корреляционный анализ (LCCA) строит линейное сопоставление между ансамблем нейронов и каноническими переменными (Hotelling, 1936; Anderson, 1984; Friman et al., 2007). Однако более информативные нейронные канонические переменные могут быть извлечены из активности нейронного ансамбля с использованием нелинейного метода. Недавно разработанный глубокий канонический корреляционный анализ (DCCA) позволяет нам изучить эту возможность, аппроксимируя нелинейное сопоставление активности нейронного ансамбля с каноническими переменными с помощью DNN (Andrew et al., 2013). Предыдущие исследования неинвазивного интерфейса мозг-компьютер (BCI) показали эффективность DCCA как средства извлечения признаков из электроэнцефалограммы, связанных с различными представляющими интерес ковариантами, такими как движения глаз и частоты зрительных стимулов (Vu et al., 2016; Цю и др., 2018 г.; Лю и др., 2019). Например, Ву и др. успешно улучшили производительность стационарного визуального вызванного потенциала BCI, используя выделение признаков на основе DCCA (Vu et al., 2016). Хотя DCCA страдает от тех же трудностей с интерпретацией нейронной активности, что и DNN, канонические переменные, оцениваемые DCCA, могут эффективно представлять активность ансамбля нейронов, связанную с кинематикой. Следовательно, декодирование этих канонических переменных может обеспечить производительность, подобную или превосходящую декодирование исходных скоростей срабатывания (FR), при сохранении краткости модели декодирования.

    Основываясь на этой гипотезе, настоящее исследование направлено на изучение того, как информация о скорости руки представлена ​​в канонических переменных, найденных с помощью LCCA или DCCA, и на сравнение этих представлений с другими нейронными представлениями (PCA, FA и LDS), извлеченными из наивных множественных FR (Z E–FR ). Кроме того, мы стремимся исследовать производительность декодирования информации о скорости руки из пяти типов нейронных представлений (E-FR, PCA, FA, LCCA и DCCA) с использованием одного из двух типов декодеров, т.е.е., ЛКФ и ЛСТМ-РНН. Кроме того, мы изучаем, обеспечивает ли DCCA лучшую производительность декодирования скорости по сравнению с нейродинамическим фильтром (NDF), который представляет собой модель линейного отображения для прогнозирования кинематических переменных из скрытых состояний на основе LDS (Kao et al., 2015). В этом исследовании мы применяем различные методы декодирования к данным об активности M1 и движениях рук у двух нечеловеческих приматов, которые выполняли двухмерное задание одной рукой.

    Материалы и методы

    Наборы данных

    Два набора данных, использованных в этом исследовании, доступны в хранилище нейробиологических данных, которое называется Collaborative Research in Computational Neuroscience (Flint et al., 2012; Лоулор и др., 2018 г.; Перич и др., 2018). Каждый набор данных включает в себя записи активности коры головного мозга и движения рук, которые были получены от примата, не являющегося человеком, выполняющего задачу дотягивания руки в 2D-пространствах одной рукой (см. Рисунок 1A). Набор данных CRT (задача достижения центра наружу) Flint et al. включает действия M1 для обезьян, чтобы выполнить задачу достижения центра наружу, чтобы захватить восемь различных целей, которые были размещены с интервалом 45° по кругу с их домом, расположенным в центре (Flint et al., 2012). Набор данных SRT (задача последовательного достижения) Lawlor et al. (2018) включает активность M1 и дорсальной премоторной коры во время последовательной задачи по дотягиванию, когда ряд целей случайным образом отображался в двумерных пространствах (Lawlor et al., 2018; Perich et al., 2018). Вся корковая активность регистрировалась внеклеточно с помощью 128-канальной системы сбора данных (Cerebus, Blackrock Microsystems, Inc., Солт-Лейк-Сити, Юта, США) через 96-канальные матрицы кремниевых микроэлектродов, хронически имплантированные в область руки M1.

    Рис. 1. Обзор моделирования для оценки влияния DCCA на два декодера. (A) Поведенческие задачи для каждого набора данных. Левая панель обозначает задачу по дотягиванию к центру наружу, которую выполняла обезьяна C, а правая панель — последовательную задачу по дотягиванию, которую выполняла обезьяна M. (B) Схематическая диаграмма изображает DCCA между скоростью стрельбы и кинематическими переменными. Левые входы (L-вход) сетей обозначают наивную скорость стрельбы, а правые входы (R-вход) сетей обозначают кинематические переменные: x — и y — скорость и скорость.Пунктирная линия между сетями обозначает канонический корреляционный анализ (CCA) между левоканоническими переменными (Z DCV ) и правоканоническими переменными (X DCV ). (C) На блок-схеме показана парадигма моделирования для сравнительного исследования декодирования. (D) Ошибки прогнозирования для размерностей состояния ( q ) каждого набора данных. Закрашенный кружок обозначает правильную размерность, соответствующую минимальной ошибке предсказания для каждого метода уменьшения размерности (Yu et al., 2009). Каждый цветовой код обозначает метод уменьшения размерности.

    В этом исследовании мы проанализировали только действия M1 по разработке и тестированию декодеров. Последовательности спайков каждого нейрона были объединены в ячейки с неперекрывающимся окном 50 мс, чтобы максимизировать взаимную информацию между нейронными FR и кинематикой (Paninski et al., 2003; Suminski et al., 2010). FR оценивали по количеству спайков в ячейке, деленному на ее размер (т.е. 50 мс). Мы также преобразовали квадратный корень FR в каждом бине, чтобы сделать их более нормально распределенными для моделей линейного декодирования (Schwartz and Moran, 1999).Затем мы выполнили процесс сглаживания ядра Гаусса, чтобы уменьшить временной шум активности отдельных единиц, где стандартное отклонение ядра (SD) было определено в соответствии с Yu et al. (2009) ( SD = 80 мс в наборе данных CRT, SD = 140 мс в наборе данных SRT). Мгновенное положение руки преобразовывалось в скорость и ее абсолютное значение (скорость). Показано, что эта кинематическая комбинация (скорость и скорость) является подходящим предиктором для построения моделей настройки (Rasmussen et al., 2017). Используя скорость и скорость, мы рассчитали качество подгонки ( r 2 ) линейной модели настройки для каждого нейрона, которая была разработана на основе модели настройки косинуса (Moran and Schwartz, 1999a), выраженной как: z ( T ) = β 0 + β 1 V ( T ) + β 2 V ( T ) + ε ( T ) Где Z ( T ) является FRS , β 0 1 , β 2 — коэффициенты модели, а v( t ) и v( t ) обозначают вектор скорости и его норму (скорость) в момент времени t , соответственно.Затем были отобраны нейроны с r 2 > 0,01, где эмпирически был определен порог r 2 (>0,01). Всего этим критериям соответствовало 155 и 63 нейрона в наборах данных CRT и SRT соответственно. Наборы данных CRT и SRT включали 175 и 496 успешных испытаний соответственно, в которых животные успешно получали мишени во время выполнения заданий. Для создания и валидации декодеров первые 75% испытаний использовались для обучения, а оставшиеся 25% испытаний использовались для тестирования: обучающая и тестовая выборки набора данных CRT содержали 131 и 44 попытки соответственно, а набор данных SRT содержал 372 и 124 испытания соответственно.Каждая оценка параметров моделей, построенных в этом исследовании (см. ниже), выполнялась только с использованием обучающей выборки.

    Извлечение нейронного представления с помощью контролируемых методов обучения

    Линейный канонический корреляционный анализ

    Канонический корреляционный анализ — это один из многомерных статистических методов, который извлекает объединенные канонические переменные из случайных векторов z и x . В этом исследовании Z и x Собрать FRS [ Z 1 , Z 2 , …, Z M ] T M × 1 от м нейронов и рукой кинематика [ x 1 , x

    1 2 , x 9201 3 ] t 3 × 1 , где x 1 и x 2 обозначают скорость координат x — и y соответственно, а x 3 — скорость.LCCA ищет линейные отображения от z и x к каноническим переменным, максимизируя корреляции между каноническими переменными (Hotelling, 1936; Anderson, 1984; Friman et al., 2007). Канонические коэффициенты {α,β} на этих линейных отображениях определяются как

    {α*,β*}=argmaxα*,β*ρ(αTz,βTx)(1)

    =argmaxα*,β*αTΣZXβαTΣZα⋅βTΣXβ(2)

    , где ρ(⋅) обозначает функцию корреляции между каноническими переменными. Σ Z и Σ X — ковариационные матрицы централизованных данных z¯ и x¯ соответственно, а Σ ZX — выборочная матрица кросс-ковариации.X) канонические переменные Z LCV и X LCV соответственно.

    Глубокий канонический корреляционный анализ

    DCCA — это один из передовых методов CCA, основанный на DNN. DCCA находит нелинейные отображения от z и x к каноническим переменным с помощью сложенных слоев нелинейного преобразования, как показано на рисунке 1B (Andrew et al., 2013). Нелинейные отображения fzl(z) и fxl(x) определяются как

    fzl(z)=σ(Wl(Z)ul-1(Z)+bl(Z))∈ℝm×1(6)

    fxl(x)=σ(Wl(X)ul-1(X)+bl(X))∈ℝ3×1(7)

    , где Wl(⋅) обозначает матрицу весов на l-м слое , ul-1(⋅) — выходной вектор из ( l− 1) -го слоя , bl(⋅) есть вектор смещений на l-м слое , а σ(⋅) – нелинейная функция.Набор параметров θ, который включает W и b , оценивается путем максимизации корреляций между функциональными выходами следующим образом:

    argmaxθZ*,θX*ρ(fZ(z,θZ),fX(x,θX))(8)

    Для поиска θZ* и θX* используется алгоритм обратного распространения для оптимизации параметров W и b на основе градиента ρ(⋅). Параметры в каждом слое инициализируются заранее в процессе предварительной подготовки с использованием шумоподавляющего автоэнкодера (Винсент и др.X) канонические переменные Z DCV и X DCV соответственно.

    В дополнение к θ нам также необходимо оптимизировать гиперпараметры DNN, для чего мы использовали метод байесовской оптимизации (Ahmadi et al., 2019). Для оптимизации гиперпараметров мы эмпирически задаем диапазон для каждого параметра: количество узлов в слое ∈ {2 4 , 2 5 , …, 2 10 }, количество слоев ∈ {1, 2 , …, 4}, размер пакета кодировщика и декодера ∈ {2 5 , 2 6 , …, 2 8 }, скорость обучения ∈ {1e−5, 1e−4, …, 1e−2 }, параметр регуляризации для каждого представления ∈ {1e−6, …, 1e−1}, параметр затухания веса (или параметр регуляризации L 2 ) ∈ {1e−6, …, 1e−1} и компромиссный параметр ∈ {1e−6, …, 1e−1}.В то время как другие параметры определяют обучение и архитектуру общей DNN, параметр компромисса используется для регуляризации корреляций с квадратичным штрафом, однозначно связанным с DCCA. Байесовская оптимизация итеративно выполняется 1000 раз для выбора надежных параметров. В таблице 1 показаны оптимизированные гиперпараметры, полученные в этом исследовании для каждого набора данных с использованием общедоступного набора инструментов MATLAB для DCCA (Wang et al., 2015).

    Таблица 1. Оптимизированные гиперпараметры DCCA для каждого набора данных.

    Извлечение нейронного представления с помощью неконтролируемых методов обучения

    В целях сравнения мы также извлекли низкоразмерные представления импульсной активности нейронной популяции, используя несколько методов, включая PCA, FA и LDS, которые широко используются для интракортикальных ИМТ. Ниже мы кратко опишем каждый метод.

    Анализ главных компонентов

    Мы применили анализ основных компонентов (PCA) к данным FR всех нейронных единиц. Процесс сглаживания ядра Гаусса использовался в качестве предварительной обработки для FR перед применением PCA, чтобы избежать случая, когда нейроны с сильно колеблющейся скоростью возбуждения влияют на декодирование (Yu et al., 2009). Затем мы извлекли главные компоненты (PC) FR, используя PCA из обучающих данных. Обратите внимание, что PCA был выполнен на основе одного испытания, а не усредненных данных, чтобы сосредоточиться на ковариации между нейронными единицами в отдельных испытаниях. Чтобы определить количество ПК, которые будут включены в набор нейронных представлений, мы следовали процедуре, предложенной Yu et al. (2009). Вкратце, используя собственные векторы, полученные из обучающей выборки, мы извлекли все ПК (т. е. столько же нейронных единиц) для проверочной выборки, которые затем были отсортированы по величине соответствующих собственных значений по убыванию.После этого мы отобрали первые 5 ПК и реконструировали по ним ФР. Рассчитывалась средняя абсолютная ошибка между истинными FR и реконструированными FR. Мы продолжали добавлять следующие 5 ПК, реконструируя FR и вычисляя ошибку так же, как описано выше. В результате минимальная ошибка реконструкции была достигнута с первыми 5 ПК для обоих наборов данных CRT и SRT (рис. 1D), которые представляли собой нейронные представления PCA, обозначенные как Z PCA . Обратите внимание, что процесс сглаживания был снова применен к окончательному набору ПК перед декодированием.

    Факторный анализ

    Факторный анализ (FA) позволяет нам находить низкоразмерные латентные факторы для выяснения общей изменчивости деятельности популяции (Santhanam et al., 2009). Опять же, мы выполнили сглаживание FR до применения FA. Для оценки латентных факторов по FR мы приняли метод FA, предложенный Yu et al., который скорректировал FA для нейронных данных (Yu et al., 2009; Kao et al., 2015). Затем аналогично PCA определяли количество факторов, входящих в набор нейронных представлений, используя ошибку реконструкции тестового набора.Мы нашли минимальную ошибку с 20 факторами для наборов данных CRT и SRT, которые в дальнейшем использовались как набор нейронных представлений FA, обозначенный как Z FA .

    Линейная динамическая система для состояний M1

    Наблюдаемую активность популяции нейронов можно интерпретировать как зашумленное наблюдение низкоразмерных и динамических нейронных состояний (Shenoy et al., 2013; Kao et al., 2015). Используя подход к оценке нейронного состояния на основе LDS, предложенный Kao et al. (2015), мы оценивали динамические латентные состояния нейронов по активности популяции.Мы определили размерность нейронных состояний, используя описанную выше процедуру на основе ошибки реконструкции. Мы установили размерность 20 для наборов данных CRT и SRT, с которой была достигнута минимальная ошибка реконструкции. Вектор этого нейронного состояния использовался LDS в качестве нейронного представления, обозначенного как Z LDS . Обратите внимание, что мы использовали линейный фильтр [формально называемый нейронным динамическим фильтром (NDF)] вместо фильтра Калмана при декодировании Z LDS , потому что Z LDS уже представляет скрытую динамику нейронной активности, так что оценка состояния фильтра Калмана может быть неверна. подходит для этого.X), при условии, что линейные или нелинейные отображения LCCA или DCCA построены соответствующим образом. Чтобы подтвердить это предположение, мы провели анализ настройки не только нейронных канонических переменных, но и других нейронных представлений с использованием модели линейной регрессии, в которой было проанализировано качество настройки каждого нейронного представления в отношении скорости и скорости. Модель временной линейной регрессии одного нейронного представления ( z ) к кинематическим параметрам ( x ) была представлена ​​как + ϵ( t ), где β 0 и β обозначают коэффициенты, а ϵ( t ) — член ошибки в момент времени t (Schwartz and Moran, 1999, 2000; Paninski et al., 2003; Расмуссен и др., 2017). Качество настройки нейронного представления оценивалось по степени соответствия ( r 2 ) модели настройки. В дополнение к этому мы также рассчитали производительность декодирования, используя каждое нейронное представление в обучающих данных с линейным фильтром Калмана. Производительность декодирования измерялась средней абсолютной ошибкой между фактической и декодированной скоростью из обучающих данных. Наконец, мы оценили прогностическую эффективность каждого из пяти приведенных выше нейронных представлений во время обучения, используя как качество подгонки модели настройки, так и ошибку обучения.

    Алгоритмы декодирования

    Фильтр Калмана

    Линейный фильтр Калмана (LKF) — один из популярных методов генеративного декодирования, основанный на линейной динамической системе (Wu et al., 2006). ЛКФ следует правило на первом порядке Маркову, такое, что государственный вектор (скорость и скорость) T T Время T Evolves от X T 1 в момент t −1.В данном исследовании вектор состояния соответствует вектору кинематических параметров. Модель системы, которая описывает переход состояний, и модель наблюдения, которая описывает генерацию наблюдения o t из x t , задаются как

    xt=Axt-1+Qt-1(9)

    от=Hxt+Vt(10)

    , где A обозначает матрицу параметров модели системы, H — матрицу параметров модели наблюдения, а Q и V — шум процесса и наблюдения, следующие распределению Гаусса, соответственно.Вектор нейронного наблюдения o t может быть либо вектором Z E–FR ( z t ), либо вектором других нейронных представлений. Чтобы предсказать x t , мы инициализировали x 0 = 0 в начале каждого испытания после предварительной сходимости усиления Калмана к его устойчивому состоянию (Dethier et al., 2013).

    Долговременная кратковременная память в рекуррентных нейронных сетях

    LSTM-RNN, основанная на архитектуре RNN, хорошо подходит для прогнозирования кинематики на основе активности нейронов (Ahmadi et al., 2019). Компоненты LSTM-RNN пронумерованы следующим образом: c — ячейка памяти, f — вентиль забывания, i и o — вентили ввода и вывода, которые соответствуют l , где l обозначает количество скрытых единиц. LSTM-RNN работает, регулируя информационный поток с помощью этих ворот через ячейку. Учитывая W как матрицу весов по отношению к рекуррентному соединению или вводу/выводу, h как вектор скрытого слоя и b как вектор смещений, каждый вентиль можно вычислить по

    ft=σsigmoid(Wf,zyt+Wf,lht-1+bf)(11)

    it=σsigmoid(Wi,zyt+Wi,lht-1+bi)(12)

    ot=σsigmoid(Wo,zyt+Wo,lht-1+bo)(13)

    , где входной вектор y является либо вектором Z E–FR ( z t ), либо вектором других нейронных представлений в момент времени t и σ 203209 ⋅ sigmoid ) обозначает сигмоидальную функцию активации.Нижние индексы указывают на соответствующие вентили и их рекуррентное соединение. Информационный поток ячейки памяти может обновляться по

    cu=σtanh(Wc,zzt+Wc,lht-1+bc)(14)

    ct=ft⊗ct-1+it⊗cu(15)

    ht=ot⊗σtanh(ct)(16)

    , где σ tanh (⋅) обозначает функцию гиперболического тангенса, а ⊗ обозначает поэлементное произведение. Для обучения LSTM-RNN мы использовали встроенный в оптимизатор Adam набор инструментов глубокого обучения MATLAB. Гиперпараметры LSTM-RNN были оптимизированы байесовским оптимизатором так же, как DCCA.Байесовский оптимизатор выполнил оценку целевой функции 500 раз. В нашем анализе мы установили коэффициент затухания градиента равным 0,95, а квадрат коэффициента затухания градиента — равным 0,99. Затем тренировочные партии перемешивались в каждую эпоху для повышения эффективности обучения. В таблице 2 показаны оптимизированные гиперпараметры для LSTM-RNN.

    Таблица 2. Оптимизированные гиперпараметры по отношению к парам представлений для LSTM-RNN (набор данных CRT/SRT).

    Оценка производительности декодирования

    Чтобы оценить влияние CCA на декодирование, мы составили три представления активности нейронов: Z E–FR , Z PCA , Z FA , Z LDS , Z LCV и Z DCV . (см. рисунок 1С).В этом исследовании мы выполнили декодирование, чтобы предсказать скорость руки X VEL из каждого нейронного представления с использованием LKF и LSTM-RNN.(t)| at time t , а n — количество проб в i -м испытании.Чтобы сравнить производительность декодирования между нейронными представлениями (Z E–FR , Z PCA , Z FA , Z LDS , Z LCV и Z DCV ), мы применили тест Фридмана к оценить влияние входных данных декодера в соответствии с типами декодеров (LKF и LSTM-RNN). Для теста Фридмана зависимые переменные состоят из ошибки декодирования, а факторы включают вход декодера и тип декодера. Мы также выполнили статистический анализ постфактум с использованием поправки Бонферрони ( p < 0.05).

    Результаты

    Сначала мы исследовали корреляции между нейронными и кинематическими каноническими переменными. На рисунке 2 показаны корреляции между каноническими переменными, каждая из которых получена из скоростей стрельбы ( Z ) и кинематики ( X ) соответственно. Канонические переменные были получены из тестового набора либо с использованием LCCA, либо DCCA. Были рассчитаны корреляции между соответствующими парами нейральных и кинематических канонических переменных, где всего три пары определялись количеством кинематических параметров.DCCA привел к более высоким корреляциям, чем LCCA для каждого набора данных: коэффициенты корреляции для набора данных CRT варьировались от 0,93 до 0,95 с использованием DCCA и от 0,84 до 0,90 с использованием LCCA ( p < 0,01, критерий суммы рангов Уилкоксона), а коэффициенты корреляции для набора данных SRT колебался от 0,81 до 0,89 при использовании DCCA и от 0,71 до 0,86 при использовании LCCA ( p < 0,01, критерий суммы рангов Уилкоксона).

    Рис. 2. Корреляции между каноническими переменными. (A) Корреляции между каноническими переменными, извлеченными с помощью LCCA (Z LCV и X LCV ). (B) Корреляции между каноническими переменными, извлеченными DCCA (Z DCV и X DCV ). Треугольники, направленные вверх, обозначают выборки на временной шаг канонических переменных. ρ обозначает коэффициент корреляции Пирсона, а p указывает на существование значительной зависимости линейной регрессии между X и Z . Каждая строка соответствует каждой размерности канонических переменных. Оранжевые треугольники обозначают набор данных CRT, а синие треугольники обозначают набор данных SRT.

    Затем мы рассмотрели настройку нейронных FR и нейронных представлений (Z E–FR , Z PCA , Z FA , Z LDS , Z LCV и Z DCV ) относительно кинематических параметров. (X VEL ) с помощью тестового набора. Качество настройки измерялось с помощью r 2 модели линейной регрессии с X VEL в качестве регрессоров (см. раздел «Анализ нейронных представлений»).

    На рис. 3 показаны примеры фактических значений Z E–FR , Z LCV и Z DCV , а также расчетных значений по модели настройки линейной скорости.Для Z E–FR был выбран нейрон, FR которого наиболее точно оценивались моделью (т.е. наибольшее значение r 2 ). Среди нейронных представлений, проанализированных здесь, линейная модель наиболее точно отслеживала изменение Z DCV , давая наивысшее значение r 2 (критерий Фридмана, поправка Бонферрони, p <0,05). Примечательно, что линейная модель может оценивать даже неизменные во времени части Z DCV (см. нижнюю строку рисунка 3), которые часто охватывают несколько испытаний, даже если X VEL менялся в течение этих периодов.

    Рисунок 3. Оценка нейронных представлений с помощью моделей настройки линейной скорости (данные тестирования). Отдельные следы реальных нейронных представлений с течением времени в каждом испытании тестовых данных (серые линии) накладываются на соответствующие оценки с помощью модели настройки линейной скорости (красные линии). Здесь мы представляем репрезентативные трассы нейронных репрезентаций, которые были наиболее точно оценены моделями настройки линейной скорости, дающими наибольшее значение r 2 , где r 2 обозначает степень согласия линейной настройки скорости. модель.В верхней строке указана оценка Z E–FR в каждом наборе данных (CRT и SRT). Со второй по четвертую строки приведены оценки Z PCA , Z FA и Z LDS в каждом наборе данных. Нижние две строки обозначают оценку Z LCV и Z DCV . Столбцы (A) и (B) соответствуют наборам данных CRT и SRT соответственно.

    На рисунках 4A,B показано распределение r 2 для Z E–FR , Z LCV и Z DCV в наборах данных CRT и SRT соответственно.Средние значения r 2 для Z DCV (0,93 в наборе данных CRT и 0,74 в наборе данных SRT) и Z LCV (0,85 в наборе данных CRT и 0,67 в наборе данных SRT) были значительно выше, чем для Z PCA (0,40 в наборе данных CRT и 0,30 в наборе данных SRT), Z FA (0,17 в наборе данных CRT и 0,13 в наборе данных SRT) и Z LDS (0,14 в наборе данных CRT и 0,17 в наборе данных SRT) (критерий Фридмана, множественное сравнение с поправкой Бонферрони, p < 0.05). Кроме того, нейронные канонические переменные, найденные с помощью DCCA (Z DCV ), были более настроены на скорость, чем те, которые были получены с помощью LCCA (Z LCV ) (критерий суммы рангов Уилкоксона: p = 0,02 в наборе данных CRT, p = 0,04 в наборе данных SRT). Более того, нейронные канонические переменные, обнаруженные с помощью DCCA (Z DCV ), были более приспособлены к скорости, чем те, которые были получены с помощью LCCA (Z LCV ). На рисунках 4C,D показаны топографические карты нейронных канонических переменных, показывающие высокие значения r 2 в двумерном пространстве скоростей.Хотя Z LCV и Z DCV были созданы для максимизации корреляций с каноническими переменными кинематики, а не кинематики как таковой , они показали настройку с фактической скоростью.

    Рисунок 4. Свойства настройки скорости нейронных канонических переменных, оцененные по нейронным представлениям. (A,B) Точки обозначают качество настройки линейной скорости ( r 2 ) для всех размерностей входных переменных (Z E–FR , Z PCA , Z FA , Z LDS , Z LCV и Z DCV ).Красная горизонтальная линия обозначает усредненные r 2 всех измерений. Черный указатель, указывающий влево, обозначает 95-процентный уровень достоверности каждого нейронного представления r 2 . (C,D) Каждая панель изображает топографическую карту входной переменной для кинематических переменных, таких как скорость ( v ). В этом случае каждая панель соответствует лучше всего настроенной размерности, показывая высокое значение r 2 .

    Затем мы изучили как ошибку обучения, так и среднее значение r 2 каждого нейронного представления, как показано на рисунке 5.Это показывает, что Z DCV дал не только самые высокие r 2 , но и самую низкую ошибку обучения (0,09 в наборе данных CRT, 0,12 в наборе данных SRT). Хотя мы также наблюдали относительно низкую ошибку обучения с использованием нейронных представлений FA и LDS, среднее значение r 2 из них не было высоким по сравнению с таковым для CCA.

    Рисунок 5. Соотношение между ошибкой обучения и средним значением настройки скорости для каждой размерности нейронных представлений.Каждый цветной кружок соответствует среднему значению r 2 и ошибке обучения нейронного представления (Z E–FR , Z PCA , Z FA , Z LDS , Z LC4 и Z DCV ). Верхняя панель (A) и нижняя панель (B) соответствуют наборам данных CRT и SRT.

    Производительность декодирования оценивалась для каждой комбинации нейронных представлений и декодеров (см. рис. 1). На рис. 6 показаны истинные и декодированные траектории скоростей для каждой комбинации.Результаты показывают, что декодирование Z DCV дает наиболее точное предсказание скорости (критерий Фридмана с поправкой Бонферрони, p < 0,05. См. Таблицы 3, 4). На рис. 7 показаны истинная и реконструированная траектории положения в наборе данных CRT. При декодировании Z E – FR и Z LCV LSTM-RNN реконструировал положение руки более точно, чем LKF. Однако при декодировании Z DCV не было очевидной разницы между декодерами. Z DCV также привел к наименьшей дисперсии реконструированных траекторий [дисперсия, Z E–FR : x -pos = 0.83, и -pos = 0,82; Z PCA : x -pos = 1,00, y -pos = 1,01; Z FA : x -pos = 0,83, y -pos = 0,80; Z LDS (NDF): x -pos = 0,71, y -pos = 0,74; Z LCV : x -pos = 0,74, y -pos = 0,80; Z DCV : x -pos = 0,61, y -pos = 0,62 при использовании LKF, тогда как Z E–FR : x -pos = 0,87, y -pos = 0.77; Z PCA : x -pos = 0,75, y -pos = 0,79; Z FA : x -pos = 0,70, y -pos = 0,65; Z LDS : x -pos = 0,78, y -pos = 0,77; Z LCV : x -pos = 0,60, y -pos = 0,60; Z DCV : x -pos = 0,53, y -pos = 0,53 при использовании LSTM-RNN в наборе данных CRT]. Декодирование Z DCV дало наилучшие результаты восстановления положения руки с использованием либо LKF, либо LSTM-RNN (критерий Фридмана, множественное сравнение с поправкой Бонферрони, p <0.05. См. Таблицы 3, 4). Стандартные отклонения (STD) фактической скорости и положения в наборе данных CRT составляют X = 0,24 и Y = 0,26 для скорости и X = 1,82 и Y = 1,76 для положения и набор данных SRT: X = 0,21 и Y = 0,20 для скорости и X = 1,66 и Y = 1,52 для положения. Для LKF ошибка декодирования меньше STD осей X и Y фактической скорости на 5.7 и 4,2% на перерасход соответственно. При этом ошибка декодирования меньше СТД фактического положения на 72,1 и 69,1%. Для LSTM-RNN ошибка декодирования меньше STD фактической скорости на 5,7 и 4,6%, а ошибка декодирования меньше ошибок фактического положения на 72,3 и 70,0%.

    Рис. 6. Декодированная траектория скорости по каждой паре переменных (тестовые данные). В каждом столбце обозначены декодированные ( X — и Y -оси) траектории скоростей по предикторам: Z E–FR , Z PCA , Z FA , Z LDS , Z LDS , Z , и Z DCV .Сплошные серые линии обозначают фактическую скорость, а сплошные красные и синие линии изображают выходные данные линейной модели и LSTM-RNN соответственно. Для линейной модели LKF использовался для Z E–FR , Z PCA , Z FA , Z LCV и Z DCV , тогда как NDF (линейный фильтр) использовался для Z LDS . Вертикальные серые линии обозначают границу между пробными интервалами достижения. Верхняя (A) и нижняя (B) панели соответствуют наборам данных CRT и SRT.

    Таблица 3. Коэффициенты корреляции декодированной скорости (наборы данных CRT и SRT).

    Таблица 4. Ошибки декодирования скорости и положения (наборы данных CRT/SRT).

    Рис. 7. Реконструированная траектория положения в наборе данных CRT (данные тестирования). Каждая панель обозначает реконструированные траектории положения в соответствии с предикторами: Z E–FR , Z PCA , Z FA , Z LDS , Z LCV и Z DCV .Сплошные серые линии обозначают траектории истинного положения, красные линии обозначают траектории положения, реконструированные на основе выходных данных линейной модели, а синие линии обозначают траектории положения на основе выходных данных LSTM-RNN. Для линейной модели LKF использовался для Z E–FR , Z PCA , Z FA , Z LCV и Z DCV , тогда как NDF (линейный фильтр) использовался для Z LDS . Закрашенный желтый кружок обозначает исходное положение (0, 0), из которого нечеловеческие приматы начали двигать руками.Сплошные линии обозначают усредненные траектории положения по испытаниям, а заштрихованные линии обозначают стандартные ошибки по 44 испытаниям в каждом направлении.

    На рис. 8А показано сравнение ошибки декодирования скорости руки для различных нейронных представлений и декодеров. Для набора данных CRT односторонний тест Фридмана выявил основной эффект нейронной репрезентации (Z FR , Z PCA , Z FA , Z LDS , Z LCV и ZV DC). ) на ошибку декодирования при использовании LKF (χ 2 = 166.6, p < 0,01) или при использовании LSTM-RNN (χ 2 = 128,1, p < 0,01). При использовании LKF апостериорный тест множественного сравнения с коррекцией Бонферрони показал меньшую ошибку декодирования с Z DCV , чем с другими нейронными представлениями ( p s <0,01), за исключением Z LDS ( p = 0,25). При использовании LSTM-RNN он также показал более низкую ошибку декодирования с Z DCV , чем другие нейронные представления ( p s <0.01). Для набора данных SRT тест Фридмана выявил основное влияние нейронной репрезентации на ошибку декодирования при использовании LKF (χ 2 = 75,8, p < 0,01) или при использовании LSTM-RNN (χ 2 = 25,7, р < 0,01). При использовании LKF апостериорный тест показал меньшую ошибку декодирования с Z DCV , чем с другими нейронными представлениями ( p s <0,01), за исключением Z LDS ( p ≅ 1). При использовании LSTM-RNN он показал более низкую ошибку декодирования с Z DCV , чем с Z E–FR ( p <0.01), но не показывает разницы между Z DCV и другими представлениями ( p s > 0,05).

    Рисунок 8. Сравнение ошибки декодирования для скорости между нейронными представлениями для каждого декодера. Средняя ошибка декодирования скорости руки (A) и реконструкции положения руки (B) из декодированной скорости [из шести различных нейронных представлений (т. е. Z E–FR , Z PCA , Z FA , Z LDS , Z LCV и Z DCV )] (описания нейронных представлений см. в тексте) с использованием декодеров [линейная модель (оранжевый) и LSTM-RNN (фиолетовый)].Для линейной модели LKF использовался для Z E–FR , Z PCA , Z FA , Z LCV и Z DCV , тогда как NDF (линейный фильтр) использовался для Z LDS . Вертикальные линии обозначают стандартную ошибку, а звездочки обозначают значимо отличающиеся отношения [ p < 0,05, ∗∗ p < 0,01, критерий Фридмана с множественными сравнениями (с поправкой Бонферрони)]. Левый и правый столбцы соответствуют наборам данных CRT и SRT соответственно.

    На рис. 8В показано сравнение ошибки между истинным и реконструированным положением руки. Для набора данных CRT тест Фридмана выявил основное влияние нейронной репрезентации на ошибку положения при использовании LKF (χ 2 = 71,9, p < 0,01) или при использовании LSTM-RNN (χ 2 = 80,7, р < 0,01). При использовании LKF апостериорный тест показал меньшую ошибку с Z DCV , чем нейронные представления ( p s < 0.01). При использовании LSTM-RNN он показал меньшую ошибку с Z DCV , чем другие нейронные представления, за исключением Z LCV ( p = 0,53). Для набора данных SRT тест Фридмана выявил основное влияние нейронного представления на ошибку положения при использовании LKF (χ 2 = 33,1, p < 0,01) или при использовании LSTM-RNN (χ 2 = 13,6). , р < 0,01). При использовании LKF апостериорный тест показал меньшую ошибку с Z DCV , чем другие нейронные представления, за исключением Z LDS ( p = 0.06). При использовании LSTM-RNN он показал меньшую ошибку с Z DCV , чем с Z LDS ( p <0,01), тогда как не было никакой разницы между Z DCV и другими.

    Кроме того, мы оценили возможные эффекты взаимодействия нейронных представлений и типов декодеров с помощью двустороннего теста Фридмана (рис. 9). Для набора данных CRT двусторонний тест Фридмана выявил основные эффекты декодера [χ 2 (1) = 116,9, p < 0,01] и нейронного представления [χ 2 (2) = 261.9, p <0,01] на ошибку декодирования скорости (рис. 9А). Апостериорный тест с поправкой Бонферрони показал меньшую ошибку при использовании LSTM-RNN, чем при использовании LKF для всех нейронных представлений ( p <0,01). Для всех декодеров ошибка декодирования скорости с Z DCV была меньше, чем любые другие нейронные представления ( p с <0,01). Для набора данных SRT двусторонний тест Фридмана выявил основной эффект декодера [χ 2 (1) = 175.4, p < 0,01] и нейронной репрезентации [χ 2 (2) = 59,0, p < 0,01]. Апостериорный тест показал меньшую ошибку при использовании LSTM-RNN, чем при использовании LKF ( p <0,01). Для всех декодеров ошибка декодирования скорости с Z DCV была меньше, чем Z E–FR и Z PCA ( p с < 0,01).

    Рисунок 9. Сравнение ошибки декодирования скорости и восстановленного положения между нейронными представлениями для всех декодеров.Средняя ошибка (незаштрихованные квадраты) декодирования руки (A) скорости и (B) положения из шести различных нейронных репрезентаций (то есть, Z E–FR , Z PCA , Z FA , Z LDS , Z LCV и Z DCV ) (см. текст для описания нейронных представлений) с использованием декодеров [линейная модель (красный) и LSTM-RNN (синий)]. Для линейной модели LKF использовался для Z E–FR , Z PCA , Z FA , Z LCV и Z DCV , тогда как NDF (линейный фильтр) использовался для Z LDS .Вертикальные линии обозначают стандартную ошибку, а звездочки обозначают значимо отличающиеся отношения )]. Левый и правый столбцы соответствуют наборам данных CRT и SRT соответственно.

    На рис. 9В показан тот же двусторонний статистический анализ ошибки между истинным и реконструированным положениями рук. Для набора данных CRT двусторонний тест Фридмана выявил основные эффекты декодера [χ 2 (1) = 4.4, p < 0,05] и нейронное представление [χ 2 (2) = 143,1, p < 0,01] на ошибку положения. Апостериорный тест не показал различий между декодерами ( p = 0,3). Для всех декодеров ошибка положения с Z DCV была меньше, чем для любых других нейронных представлений ( p с <0,01). Для набора данных SRT он показал основные эффекты декодера [χ 2 (1) = 14,3, p <0,01] и нейронного представления [χ 2 (2) = 28.2, p < 0,01]. Апостериорный тест не показал различий между декодерами ( p = 0,1). Для всех декодеров ошибка позиционирования с Z DCV была меньше, чем для любых других нейронных представлений ( p с <0,05).

    Обсуждение

    В этом исследовании мы предложили метод идентификации низкоразмерных представлений активности FR нейронов M1 с использованием канонического корреляционного анализа. Кроме того, мы применили эти канонические переменные к моделям декодирования, чтобы предсказать движения рук нечеловеческих приматов, и сравнили влияние нейронных репрезентаций на производительность декодирования.Как и ожидалось, мы подтвердили, что канонические переменные, найденные с помощью DCCA, хорошо соответствуют скорости руки. Декодирование информации о движении руки с использованием канонических переменных, оцененных с помощью DCCA, привело к более высокой производительности как в случаях с использованием канонических переменных, оцененных с помощью LCCA, так и с использованием других нейронных представлений, независимо от типа декодера, то есть LKF или LSTM-RNN. В частности, производительность LKF была значительно выше при использовании DCCA, чем при декодировании FR с использованием LSTM-RNN. Эти результаты показывают, что мы можем разработать простой линейный декодер (LKF) с DCCA, достигнув при этом производительности такой же хорошей, как при использовании относительно сложных DNN.

    Улучшение декодирования активности M1 с использованием LCCA или DCCA может быть частично связано с тем, что канонические переменные, обнаруженные с их помощью, показали лучшую настройку на скорость по сравнению с другими нейронными представлениями, включая отдельные нейронные FR (рис. 3). Следовательно, LKF, в значительной степени опирающийся на качество моделей наблюдения, может извлечь выгоду из извлеченных канонических переменных, даже если LCCA значительно сократил количество нейронных переменных. В частности, нейронные канонические переменные с оценкой DCCA показали лучшие индексы настройки ( r 2 ), чем нейронные канонические переменные с оценкой LCCA, что впоследствии привело к лучшей производительности декодирования DCCA.Между тем, ошибка обучения, которая напрямую отражает качество обучения модели декодирования, показала превосходство над другими нейронными представлениями вместе с r 2 . Это открытие указывает на то, что нелинейные проекции могут быть более подходящими для извлечения совместных канонических переменных между высокоразмерной нейронной активностью и низкоразмерными кинематическими параметрами. Однако DCCA не может обеспечить прямую связь между каноническими переменными и отдельными нейронами, что может сделать LCCA.

    Помимо лучших характеристик канонических переменных, может быть еще одна причина, по которой DCCA улучшила декодирование с использованием LKF, а другие нейронные репрезентации — нет.Известно, что PCA с трудом различает изменения в основном нервном состоянии, что становится ограничением для декодирования кинематической информации из шумовой активности (Yu et al., 2009). Хотя FA также является полезной основой для выделения независимой и общей изменчивости между нейронами, она следует предположению, что дисперсия шума отдельного нейрона фиксирована во времени (Yu et al., 2009). Прежде всего, поскольку эти подходы (включая LDS) направлены на извлечение латентных состояний популяционной активности без кинематической информации, трудно выделить сложные компоненты, связанные со сложным движением.Это может быть разумной причиной того, почему DCCA показал лучшую производительность при моделировании декодирования, чем нейронные представления с помощью методов обучения без учителя.

    Что касается методов декодирования, то DNN, представленная здесь LSTM-RNN, эффективно декодировала паттерны возбуждения популяции нейронов, поскольку она может эффективно обрабатывать временную динамику нейронов через ячейки памяти в относительно краткой сетевой архитектуре. Кроме того, модель в пространстве состояний, такая как LKF, демонстрирует преимущество представления временной динамики кинематики в своей системной модели, но ее модель линейной системы первого порядка может оказаться недостаточной для объяснения кинематической динамики движений рук.Кроме того, модель прямого декодирования, такая как LSTM-RNN, может быть свободна от каких-либо статистических предположений о данных, что часто необходимо в генеративной модели, такой как LKF. Наши результаты, показывающие превосходную производительность LSTM-RNN по сравнению с LKF, соответствуют результатам предыдущих отчетов (например, Ahmadi et al., 2019).

    В дополнение к прямому отображению скорости через декодеры можно было бы принять во внимание более простое линейное отображение; например, мы можем просто восстановить скорость из канонических кинематических представлений (X LCV или X DCV ), которые были оценены из соответствующих нейронных представлений (Z LCV или Z DCV ).Чтобы проверить, работает ли это простое отображение, мы попытались реконструировать скорость только с помощью LCCA и DCCA без явных декодеров следующим образом. Во-первых, мы оценили X LCV (или X DCV ) по Z LCV (или Z DCV ) с помощью линейной регрессии, такой как

    Xk=α0+α1Zk+e(18)

    где x

    1 K Z 9201 K RE

    9 k K -ля каноническая переменная, соответственно, E представляет собой остаточную ошибку и α 0 и α 1 — канонические коэффициенты.Во-вторых, мы реконструировали скорость по предполагаемой скорости X LCV (или X DCV ) во время тестирования. Для LCCA реконструкция скорости была простой путем инвертирования линейного отображения между X LCV и скоростью. Для DCCA скорость была реконструирована обратной функцией активации (здесь логит-функцией) и линейной моделью между слоями, которая была выражена как:

    -log((βl,l-1XWl-1-1)-1)(19)

    Где β L, L

    L, L

    1 представляет коэффициенты между выходами слоя L и L- 1, и W L — это матрица веса в л -й слой.Мы заметили, что реконструированная скорость с помощью этой процедуры показала более низкую производительность, чем прямое декодирование Z (Z LCV или Z DCV ) в скорость с использованием LKF в среднем на 9,9% (11,4% для LCCA и 8,3% для DCCA). По-видимому, этот анализ подтвердил, что прямое восстановление скорости с помощью карт, построенных CCA, было хуже, чем с помощью предложенных методов декодирования для прогнозирования скорости на основе нейронных представлений с использованием LKF или LSTM-RNN.

    Мы можем ожидать, что размерность популяций нейронов будет увеличиваться еще больше по мере развития нейротехнологии крупномасштабных нейронных записей в ближайшем будущем.Такое развитие событий поднимет вопрос о том, насколько эффективно мы должны разработать декодер для внутрикортикальных ИМТ. Наши результаты показывают, что DCCA, наряду с другими методами уменьшения размерности, может обеспечить преимущества для построения компактного, но информативного пространства признаков для эффективного декодирования. В отличие от неконтролируемых методов уменьшения размерности без кинематической информации, DCCA может найти низкоразмерное пространство, чтобы максимизировать корреляции с целевыми кинематическими параметрами, увеличивая шанс улучшить прогнозирование кинематических параметров, таких как скорость, на основе активности нейронов.Хорошо известно, что декодирование информации о скорости протезного устройства из нейронной активности может быть полезно для ИМТ в клинических условиях (Kim et al., 2008; Wodlinger et al., 2015). Поэтому мы предполагаем, что наш предложенный метод может быть предпочтительнее, если учитывать эффективность и производительность ИМТ.

    Хотя это исследование показывает возможность улучшения декодирования ИМТ с использованием предложенного метода, мы не проверили его в парадигме онлайн-контроля ИМТ, что должно быть проведено в будущей работе.При применении текущего метода декодирования к онлайн-ИМТ у людей с тетраплегией, где кинематическая информация о конечностях недоступна, мы должны рассмотреть, как извлечь кинематику целевого протеза. Чтобы решить эту проблему, во многих предыдущих исследованиях ИМТ человека использовалась парадигма обучения, в которой участники представляли движения конечностей в соответствии с заданным движением объекта, показанного на экране. Затем можно было бы построить алгоритм декодирования, связывая активность M1, возникающую во время воображения движения, с кинематикой объекта (Hochberg et al., 2006; Ким и др., 2008 г.; Афлало и др., 2015; Яросевич и др., 2015; Водлингер и др., 2015). Хотя может существовать значительный разрыв между истинной кинематикой и выходными данными алгоритма декодирования, изначально построенного таким образом, производительность ИМТ может быть дополнительно увеличена за счет многократного обновления одного и того же алгоритма декодирования с помощью обучения «замкнутого цикла». Важно отметить, что большинство алгоритмов декодирования, используемых в ИМТ человека, были первоначально разработаны в предварительных исследованиях на приматах, отличных от человека.Поэтому мы считаем, что наш алгоритм декодирования, основанный на глубоком CCA у нечеловеческих приматов, может аналогичным образом улучшить ИМТ человека.

    Заявление о доступности данных

    В этом исследовании были проанализированы общедоступные наборы данных. Эти данные можно найти здесь: http://crcns.org/data-sets/movements/dream и http://crcns.org/data-sets/motor-cortex/pmd-1/about-pmd-1.

    Вклад авторов

    М-КК и С-ПК задумали исследование. М-КК провел анализ и написал рукопись.J-WS и S-PK предоставили отредактированную рукопись. Все авторы внесли свой вклад в статью и одобрили представленную версию.

    Финансирование

    Это исследование было поддержано Программой исследований мозга через Национальный исследовательский фонд Кореи (NRF), финансируемый Министерством науки и ИКТ (2016M3C7A18).

    Конфликт интересов

    Авторы заявляют, что исследование проводилось при отсутствии каких-либо коммерческих или финансовых отношений, которые могли бы быть истолкованы как потенциальный конфликт интересов.

    Каталожные номера

    Афлало, Т., Келлис, С., Клаес, К., Ли, Б., Ши, Ю., Пейса, К., и др. (2015). Расшифровка двигательных образов задней теменной коры головного мозга человека с тетраплегией. Наука 348, 906–910. doi: 10.1126/science.aaa5417

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Aggarwal, V., Acharya, S., Tenore, F., Shin, H.C., Etienne-Cummings, R., Schieber, M.H., et al. (2008). Асинхронное декодирование ловких движений пальцев с помощью нейронов М1. IEEE Trans. Нейронный. Сист. Реабилит. англ. 16, 3–14. doi: 10.1109/TNSRE.2007.

    9

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Ахмади, Н., Констандиноу, Т.Г., и Буганис, К.-С. (2019). «Расшифровка кинематики рук на основе потенциалов локального поля с использованием сети долговременной кратковременной памяти (LSTM)», 9-я международная конференция IEEE/EMBS по нейронной инженерии (NER) , 2019 г., (Сан-Франциско, Калифорния: Корнельский университет), 415–419. doi: 10.1109/NER.2019.8717045

    Полнотекстовая перекрестная ссылка | Академия Google

    Эймс, К.С., Рю, С.И., и Шеной, К.В. (2014). Нервная динамика достижения после неправильной или отсутствующей двигательной подготовки. Нейрон 81, 438–451. doi: 10.1016/j.neuron.2013.11.003

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Андерсон, Т. В. (1984). Введение в многомерный статистический анализ , 2-е изд. Нью-Джерси: Джон Уайли и сыновья.

    Академия Google

    Андрей Г., Арорал, Р., Билмес, Дж., и Ливеску, К. (2013). «Глубокий канонический корреляционный анализ», в Трудах 30-й Международной конференции по машинному обучению (Атланта: Вашингтонский университет), 1247–1255.

    Академия Google

    Чапин, Дж. К., Моксон, К. А., Марковиц, Р. С., и Николелис, М. А. Л. (1999). Управление роботом-манипулятором в режиме реального времени с использованием одновременно записанных нейронов в моторной коре. Нац. Неврологи. 2, 664–670. дои: 10.1038/10223

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Чхатбар, П.Ю. и Фрэнсис, Дж. Т. (2013). На пути к натуралистическому интерфейсу мозг-машина: гибридное управление крутящим моментом и положением позволяет обобщить новую динамику. PLoS Один. 8:e52286. doi: 10.1371/journal.pone.0052286

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Детьер Дж., Нуйюджукян П., Рю С.И., Шеной К.В. и Боахен К. (2013). Разработка и проверка декодера импульсной нейронной сети в реальном времени для интерфейсов мозг-машина. Дж. Нейрал.англ. 10:036008. дои: 10.1088/1741-2560/10/3/036008

    Полнотекстовая перекрестная ссылка | Академия Google

    Фагг, А. Х., Оджакангас, Г. В., Миллер, Л. Э., и Хацопулос, Н. Г. (2009). Декодирование кинетической траектории с использованием моторных корковых ансамблей. IEEE Trans. Нейронный. Сист. Реабилит. англ. 17, 487–496. doi: 10.1109/TNSRE.2009.2029313

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Фламент, Д., и Хор, Дж. (1988). Взаимосвязь нейронных разрядов моторной коры с кинематикой пассивных и активных движений локтя у обезьяны. J. Нейрофизиол. 60, 1268–1284. doi: 10.1152/jn.1988.60.4.1268

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Флинт, Р. Д., Линдберг, Э. В., Джордан, Л. Р., Миллер, Л. Э., и Слуцкий, М. В. (2012). Точная расшифровка достигающих движений от полевых потенциалов при отсутствии спайков. Дж. Нейрал. англ. 9, 46006. doi: 10.1088/1741-2560/9/4/046006

    Полнотекстовая перекрестная ссылка | Академия Google

    Фриман О., Борга М., Лундберг П.и Кнутссон, Х. (2007). «Канонический корреляционный анализ: в прикладном многомерном статистическом анализе», в Applied Multivariate Statistical Analysis (Берлин: Springer), 321–330. дои: 10.1007/978-3-540-72244-1_14

    Полнотекстовая перекрестная ссылка | Академия Google

    Гао, Ю., Блэк, М. Дж., Биненшток, Э., Шохам, С., и Донохью, Дж. П. (2001). «Вероятностный вывод о движении руки на основе нейронной активности в моторной коре», в материалах Proceedings of the 14th International Conference on Neural Information Processing Systems: Natural and Synthetic (Канада: MIT Press), 213–220.doi: 10.7551/митпресс/1120.003.0032

    Полнотекстовая перекрестная ссылка | Академия Google

    Георгопулос А.П., Каласка Дж.Ф., Каминити Р. и Мэсси Дж.Т. (1982). О взаимосвязи между направлением двумерных движений рук и разрядом клеток моторной коры приматов. J. Neurosci. 2, 1527–1537. doi: 10.1523/jneurosci.02-11-01527.1982

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Георгопулос А. П., Кеттнер Р. Э. и Шварц А.Б. (1988). Моторная кора приматов и свободные движения рук к визуальным целям в трехмерном пространстве. II. Кодирование направления движения популяцией нейронов . J. Neurosci. 8, 2928–2937. doi: 10.1523/jneurosci.08-08-02928.1988

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Gilja, V., Nuyujukian, P., Chestek, C.A., Cunningham, J.P., Yu, B.M., Fan, J.M., et al. (2012). Высокопроизводительный нейронный протез, обеспечиваемый разработанным алгоритмом управления. Нац. Неврологи. 15, 1752–1757 гг. doi: 10.1038/nn.3265

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Голуб, М. Д., Ю, Б. М., Шварц, А. Б., и Чейз, С. М. (2014). Моторный корковый контроль скорости движения с последствиями для управления интерфейсом мозг-машина. J. Нейрофизиол. 112, 411–429. doi: 10.1152/jn.00391.2013

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Хохберг, Л. Р., Серруя, М. Д., Фрихс, Г.М., Муканд Дж.А., Салех М., Каплан А.Х. и соавт. (2006). Нейронный ансамбль управления протезами человека с тетраплегией. Природа 442, 164–171. doi: 10.1038/nature04970

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Хамфри, Д. Р. (1972). Связь импульсов моторной коры с показателями двигательной активности. Мозг Res. 40, 7–18. дои: 10.1016/0006-8993(72)

    Полнотекстовая перекрестная ссылка | Академия Google

    Хамфри, Д.Р. и Корри В.С. (1978). Свойства системы нейронов пирамидного тракта в пределах функционально определенной подобласти моторной коры приматов. J. Нейрофизиол. 41, 216–243. doi: 10.1152/jn.1978.41.1.216

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Jarosiewicz, B., Sarma, A.A., Bacher, D., Masse, N.Y., Simeral, J.D., Sorice, B., et al. (2015). Виртуальный набор текста людьми с тетраплегией с использованием самонастраивающегося интракортикального интерфейса мозг-компьютер. Науч. Перевод Мед. 7:313ra179. doi: 10.1126/scitranslmed.aac7328

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Као, Дж. К., Нуйюджукян, П., Рю, С. И., Черчленд, М. М., Каннингем, Дж. П., и Шеной, К. В. (2015). Однократная динамика моторной коры и ее приложения к интерфейсам мозг-машина. Нац. коммун. 6, 1–12. дои: 10.1038/ncomms8759

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Као, Дж.К., Нуюджукян П., Ставиский С., Рю С.И., Гангули С. и Шеной К.В. (2013). Исследование роли нормализации скорости стрельбы и уменьшения размерности в надежности интерфейса мозг-машина. Проц. Анну. Междунар. конф. IEEE Энджин. Мед. биол. соц. 2013, 293–298. doi: 10.1109/EMBC.2013.6609495

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Кауфман М.Т., Черчленд М.М., Рю С.И. и Шеной К.В. (2014). Корковая активность в нулевом пространстве: разрешение подготовки без движения. Нац. Неврологи. 17, 440–448. doi: 10.1038/nn.3643

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Ким, К. Х., Ким, С. С., и Ким, С. Дж. (2006). Превосходство нелинейного картирования при декодировании множественных последовательностей одиночных нейронов: имитационное исследование. J. Neurosci. Методы 150, 202–211. doi: 10.1016/j.jneumeth.2005.06.015

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Ким, С. П., Санчес, Дж. К., Эрдогмус, Д., Rao, Y.N., Wessberg, J., Principe, J.C., et al. (2003). Подход «разделяй и властвуй» для интерфейсов «мозг-машина»: нелинейная смесь конкурирующих линейных моделей. Нейронный. Сети 16, 865–871. дои: 10.1016/S0893-6080(03)00108104

    Полнотекстовая перекрестная ссылка | Академия Google

    Ким, С.П., Симерал, Дж.Д., Хохберг, Л.Р., Донохью, Дж.П., и Блэк, М.Дж. (2008). Нейронный контроль скорости компьютерного курсора путем декодирования двигательной активности коры головного мозга у людей с тетраплегией. Дж. Нейрал. англ. 5, 455–476. дои: 10.1088/1741-2560/5/4/010

    Полнотекстовая перекрестная ссылка | Академия Google

    Лоулор, П. Н., Перич, М. Г., Миллер, Л. Е., и Кординг, К. П. (2018). Линейно-нелинейно-временные пуассоновские модели нейронной активности. Дж. Вычисл. Неврологи. 45, 173–191. doi: 10.1007/s10827-018-06

    Полнотекстовая перекрестная ссылка | Академия Google

    Лю В., Цю Дж.-Л., Чжэн В.-Л. и Лу Б.-Л. (2019). Мультимодальное распознавание эмоций с использованием глубокого канонического корреляционного анализа. Препринт arXiv arXiv:1908.05349.

    Академия Google

    Marblestone, A.H., Zamft, B.M., Maguire, YG, Shapiro, M.G., Cybulski, T.R., Glaser, J.I., et al. (2013). Физические принципы масштабируемой нейронной записи. Фронт. вычисл. Неврологи. 7, 1–34. doi: 10.3389/fncom.2013.00137

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Моран, Д. В., и Шварц, А. Б. (1999a). Моторная корковая активность во время рисуночных движений: представление популяции при трассировке спирали. J. Нейрофизиол. 82, 2693–2704. doi: 10.1152/jn.1999.82.5.2693

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Панински, Л., Феллоуз, М.Р., Хацопулос, Н.Г., и Донохью, Дж.П. (2003). Пространственно-временная настройка двигательных корковых нейронов на положение рук и скорость. J. Нейрофизиол. 91, 515–532. doi: 10.1152/jn.00587.2002

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Перич, М. Г., Лоулор, П.Н., Кординг, К.П., и Миллер, Л.Е. (2018). Внеклеточные нейронные записи первичной и дорсальной премоторной коры макака во время выполнения последовательной задачи по дотягиванию. Доступно в Интернете по адресу: crcns.org.http://dx.10.6080/K0FT8J72 (по состоянию на май 2019 г.).

    Академия Google

    Цю, Дж. Л., Лю, В., и Лу, Б. Л. (2018). «Распознавание эмоций с несколькими представлениями с использованием глубокого канонического корреляционного анализа», на 25-й международной конференции , ICONIP 2018. (Берлин: Springer).

    Академия Google

    Рао, Ю. Н., Ким, С. П., Санчес, Дж. К., Эрдогмус, Д., Принсипи, Дж. К., Кармена, Дж. М., и соавт. (2005). «Изучение сопоставлений в интерфейсах мозговой машины с сетями эхо-состояний. в материалах. (ICASSP ’05)», в IEEE International Conference on Acoustics, Speech, and Signal Processing (Нью-Джерси: IEEE), 233–236. doi: 10.1109/ICASSP.2005.1416283

    Полнотекстовая перекрестная ссылка | Академия Google

    Санчес, Дж. К., Эрдогмус, Д., Рао, Ю., Principe, JC, Nicolelis, M., and Wessberg, J. (2003). «Изучение вклада моторной, премоторной и задней теменной коры в реконструкцию траектории руки в интерфейсе мозг-машина», в Первая международная конференция IEEE EMBS по нейронной инженерии, 2003 г. Труды конференции (Нью-Джерси: IEEE), 59– 62. doi: 10.1109/CNE.2003.1196755

    Полнотекстовая перекрестная ссылка | Академия Google

    Сантанам Г., Ю Б. М., Гиля В., Рю С. И., Афшар А., Сахани М. и др. (2009). Методы факторного анализа для высокопроизводительных нейронных протезов. J. Нейрофизиол. 102, 13:15–13:30. doi: 10.1152/jn.00097.2009

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Шварц, А.Б., Кеттнер, Р.Е., и Георгопулос, А.П. (1988). Моторная кора приматов и свободные движения рук к зрительным целям в трехмерном пространстве. I. Взаимосвязь между разрядом единичных клеток и направлением движения . Дж.Неврологи. 8, 2913–2927. doi: 10.1523/JNEUROSCI.08-08-02913.1988

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Шварц, А.Б., и Моран, Д.В. (2000). Траектория руки и представление обработки движения в моторной корковой активности. евро. Дж. Нейроски. 12, 1851–1856 гг. doi: 10.1046/j.1460-9568.2000.00097.x

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Серджио, Л. Э., Амель-Паке, К., и Каласка, Дж.Ф. (2005). Нейронные корреляты моторной коры с выходной кинематикой и кинетикой во время задач с изометрической силой и дотягиванием руки. J. Нейрофизиол. 94, 2353–2378. doi: 10.1152/jn.00989.2004

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Шанечи М.М., Орсборн А., Мурман Х., Гауда С. и Кармена Дж. М. (2014). «Высокопроизводительный интерфейс мозг-машина, обеспечиваемый адаптивным оптимальным декодером точечного процесса с обратной связью», в , 2014 г., 36-я ежегодная международная конференция IEEE Engineering in Medicine and Biology Society (Нью-Джерси: IEEE), 6493–6496.doi: 10.1109/EMBC.2014.65

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Шанечи, М.М., Орсборн, А.Л., и Кармена, Дж.М. (2016). Надежный дизайн интерфейса мозг-машина с использованием оптимального моделирования управления с обратной связью и фильтрации процессов адаптивной точки. PLoS вычисл. биол. 12:e1004730. doi: 10.1371/journal.pcbi.1004730

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Шеной К.В., Сахани М. и Черчленд М.М. (2013). Корковый контроль движений рук: перспектива динамических систем. Анну. Преподобный Нейроски. 36, 337–359. doi: 10.1146/annurev-neuro-062111150509

    Полнотекстовая перекрестная ссылка | Академия Google

    Сумински, А. Дж., Ткач, Д. К., Фагг, А. Х., и Хацопулос, Н. Г. (2010). Включение обратной связи от нескольких сенсорных модальностей улучшает управление интерфейсом мозг-машина. J. Neurosci. 30, 16777–16787. doi: 10.1038/mp.2011.182

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Суссильо, Д., Nuyujukian, P., Fan, J.M., Kao, J.C., Stavisky, S.D., Ryu, S., et al. (2012). Рекуррентная нейронная сеть для декодеров внутрикоркового интерфейса мозг-машина с обратной связью. Дж. Нейрал. англ. 9, 026027. doi: 10.1088/1741-2560/9/2/026027

    Полнотекстовая перекрестная ссылка | Академия Google

    Ван Хеммен, Дж. Л., и Шварц, А. Б. (2008). Код вектора населения: геометрическая универсалия как актуатор. Биол. киберн. 98, 509–518. doi: 10.1007/s00422-008-0215213

    Полнотекстовая перекрестная ссылка | Академия Google

    Варгас-Ирвин, К.Э., Шахнарович Г., Ядоллапур П., Мислоу Дж. М. К., Блэк М. Дж. и Донохью Дж. П. (2010). Расшифровка полных действий досягаемости и захвата из локальных популяций первичной моторной коры. J. Neurosci. 30, 9659–9669. doi: 10.1523/JNEUROSCI.5443-09.2010

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Васков А.К., Ирвин З.Т., Насон С.Р., Ву П.П., Ню К.С., Буллард А.Дж. и соавт. (2018). Корковое декодирование движений отдельных групп пальцев с использованием фильтра Калмана ReFIT. Фронт. Неврологи. 12:751. doi: 10.3389/fnins.2018.00751

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Винсент П., Ларошель Х., Бенжио Ю. и Манзагол П.-А. (2008). «Извлечение и составление надежных функций с помощью шумоподавляющих автоэнкодеров», в Proceeding ICML ’08 Proceedings of the 25th international conference on Machine Learning (Нью-Йорк: ACM Press), 1096–1103. дои: 10.1145/13

    .13

    Полнотекстовая перекрестная ссылка | Академия Google

    Ву, Х., Ку, Б., и Чой, С. (2016). «Обнаружение частоты для BCI на основе SSVEP с использованием глубокого канонического корреляционного анализа», в 2016 IEEE International Conference on Systems, Man, and Cybernetics (Токио: SMC), 001983–001987.

    Академия Google

    Ван, В., Чан, С.С., Хелдман, Д.А., и Моран, Д.В. (2007). Моторная корковая репрезентация положения и скорости во время достижения. J. Нейрофизиол. 97, 4258–4270. doi: 10.1152/jn.01180.2006

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Ван Ю., Ким, С.П., и Принсипи, Дж. К. (2005). «Сравнение алгоритмов обучения TDNN в интерфейсах мозг-машина», в Proceedings. 2005 г. Международная объединенная конференция IEEE по нейронным сетям (Нью-Джерси: IEEE), 2459–2462. doi: 10.1109/IJCNN.2005.1556288

    Полнотекстовая перекрестная ссылка | Академия Google

    Ван, Ю., Пайва, А. Р. К., Принсипи, Дж. К., и Санчес, Дж. К. (2009). Последовательная точечная оценка кинематики Монте-Карло на основе активности нейронных импульсов для интерфейсов мозг-машина. Нейронный. вычисл. 21, 2894–2930. doi: 10.1162/neco.2009.01-08699

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Wessberg, J., Stambaug, C.R., Kralik, J.D., Beck, P.D., Laubach, M., Chapin, J.K., et al. (2000). Предсказание траектории руки в реальном времени ансамблями корковых нейронов у приматов. Природа 408, 361–365. дои: 10.1038/35042582

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Уиллетт, Ф.Р., Сумински А.Дж., Фагг А.Х. и Хацопулос Н.Г. (2013). Улучшение производительности интерфейса мозг-машина за счет декодирования предполагаемых будущих движений. Дж. Нейрал. англ. 10, 026011. doi: 10.1088/1741-2560/10/2/026011

    Полнотекстовая перекрестная ссылка | Академия Google

    Wodlinger, B., Downey, J.E., Tyler-Kabara, E.C., Schwartz, A.B., Boninger, M.L., and Collinger, J.L. (2015). Десятимерное антропоморфное управление руками в интерфейсе «мозг-машина»: трудности, решения и ограничения. Дж. Нейрал. англ. 12, 1–17. дои: 10.1088/1741-2560/12/1/016011

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Ву, В., Блэк, М. Дж., Мамфорд, Д., Гао, Ю., Биненшток, Э., и Донохью, Дж. П. (2004). Моделирование и декодирование моторной корковой активности с использованием переключающего фильтра Калмана. IEEE Trans. Биомед. англ. 51, 933–942. doi: 10.1109/TBME.2004.826666

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Ву, В., Гао, Ю., Биненшток, Э., Донохью, Дж. П., и Блэк, М. Дж. (2006). Байесовское популяционное декодирование моторной активности коры с использованием фильтра Калмана. Нейронный. вычисл. 18, 80–118. дои: 10.1162/089976606774841585

    Реферат PubMed | Полный текст перекрестной ссылки | Академия Google

    Сюй К., Ван Ю., Чжан С., Чжао Т., Ван Ю., Чен В. и др. (2011). «Сравнения между линейными и нелинейными методами декодирования двигательной активности коры обезьяны», в Ежегодной международной конференции IEEE Engineering in Medicine and Biology Society , 2011 г. (Нью-Джерси: IEEE), 4207–4210.

    Академия Google

    Ю, Б.М., Каннингем, Дж.П., Сантанам, Г., Рю, С.И., Шеной, К.В., и Сахани, М. (2009). Факторный анализ гауссовского процесса для низкоразмерного однократного анализа активности нейронной популяции. J. Нейрофизиол. 102, 614–635. doi: 10.1152/jn.