Your AI powered learning assistant

Современные инструменты искусственного интеллекта для науки и образования

От Антиплагиата к Domate: Миссия по повышению академического качества Юрий Чухович, кандидат физико-математических наук, окончил МФТИ в 1999 году и аспирантуру факультета вычислительной математики и кибернетики МГУ. Он стал соучредителем и руководителем нескольких высокотехнологичных компаний, а в 2005 году возглавил разработку первой в России системы обнаружения плагиата "Антиплагиат", возглавив компанию до 2023 года. Вместе с партнерами он основал Domate, чтобы повысить качество научных работ. Domate создает инструменты для автоматической оценки научных и образовательных текстов.

Эра большого искусственного интеллекта трансформирует повседневную учебу и исследования За последние три года сервисы искусственного интеллекта стали широко использоваться студентами, исследователями, преподавателями и профессионалами для решения различных задач. Обычно они используются для помощи с заданиями, решения проблем и подготовки текстов в повседневной практике. Опросы показывают, что по меньшей мере половина студентов регулярно пользуются ИИ. Этот всплеск знаменует собой эру “большого искусственного интеллекта”.

Полезная мощность соответствует этическим рискам в академических рабочих процессах Искусственный интеллект не должен быть запрещен, но образование должно научиться сосуществовать с ним, не ставя под угрозу основные цели. Неправильное использование включает в себя поиск и перефразирование предыдущих работ, чтобы выдать их за оригинальные, или создание текстов без их прочтения или понимания. Главная задача образования — развитие навыков и знаний для формирования способных профессионалов — должна оставаться неизменной. Системы должны интегрировать искусственный интеллект, чтобы он поддерживал обучение, а не заменял его.

Мошенничество с контрактами расширяется по мере того, как Искусственный интеллект снижает временные затраты Академическое письмо на заказ существовало задолго до появления Интернета и продолжается по сей день. Современные информационные технологии и искусственный интеллект значительно упрощают создание таких работ, стимулируя рост теневого рынка. Ghostwriters рано внедрили эти технологии для автоматизации и ускорения рабочих процессов. Сокращение временных затрат повышает эффективность и без того эффективного незаконного рынка.

Монополизированный Российский рынок тормозит Прогресс В российской практике выявления плагиата де-факто доминирует единый стандарт. Почти монопольные условия приводят к слабой конкуренции, медленному развитию и ограниченному движению вперед. Это негативно сказывается на качестве и эволюции методов оценки. Множество конкурирующих решений принесли бы пользу пользователям, а Domate отличается своей целевой ориентацией.

Регулятивный дрейф и растерянное ожидание в сфере образования После появления первой волны важных документов правила проверки на плагиат практически не менялись в течение примерно девяти лет. Ответственность в основном была возложена на сами образовательные и исследовательские учреждения. Ситуация с ИИ еще менее определена, и во всем мире многие сталкиваются с такой же неопределенностью. Университеты находятся в состоянии бдительной растерянности, им не хватает четкого видения обеспечения качества в условиях массового использования искусственного интеллекта.

От контроля за авторами до оказания им помощи в улучшении их работы Системы обнаружения использовались в основном в качестве барьеров против предполагаемых злоумышленников. Во многих случаях авторы действуют без злого умысла и просто не знают, как действовать правильно. Они нуждаются в помощи, руководстве и объяснениях, а не в наказании. Конструктивный подход должен быть направлен не на защиту, а на содействие.

Чрезмерно сложные отчеты способствуют принятию ошибочных процентных решений Отчеты об оценке часто слишком сложны и требуют много времени, иногда на их анализ уходят часы или дни. Списки из сотен источников, дубликатов и устаревших элементов перегружают рецензентов. В результате многие сводят оценку к одному проценту, игнорируя контекст. Тем не менее, высокая “оригинальность” может скрывать проблемы, а низкая “оригинальность” может быть приемлемой, поэтому процент сам по себе вводит в заблуждение.

Роль руководителя: Думай, пиши и проверяй Девиз Domate — “Думай, пиши и проверяй” ‑ отражает его поддержку авторов, создающих высококачественные работы. Преподаватели, редакторы и рецензенты берут на себя выполнение рутинных задач, оставляя за людьми только ключевые решения. Цель системы - скрыть сложность и внести ясность там, где это важно. Для организаций это снижает риски и укрепляет авторитет среди студентов, персонала и регулирующих органов.

Простота снаружи, Сложность Внутри — По Замыслу Продукт соответствует метафоре “автоматической коробки передач”: минимум действий пользователя, максимальная внутренняя изощренность. Пользователи управляют автомобилем с помощью простых элементов управления, в то время как сложные механизмы работают незаметно внутри. Цель - бесперебойная работа, не вдаваясь в технические подробности.

Основные проверки: оригинальность, цитаты и попытки сокрытия информации Domate выполняет классический анализ оригинальности, уделяя особое внимание цитированию и самоцитированию. Он обнаруживает попытки скрыть заимствования. Он также обрабатывает таблицы и метаданные и поддерживает гибкую работу с источниками.

Обнаружение Текста, Сгенерированного Искусственным Интеллектом, Теперь имеет Важное Значение Система идентифицирует текст, созданный с помощью искусственного интеллекта, в представленных материалах. Обработка обнаруженного контента с использованием искусственного интеллекта остается отдельным политическим решением для учреждений. Отчетность об использовании ИИ‑текста стала необходимым компонентом оценки.

Целостность библиографии и сфабрикованные ссылки Domate уделяет особое внимание библиографическому анализу, в том числе выявлению несуществующих или фальсифицированных ссылок. Поскольку модели искусственного интеллекта созданы для создания правдоподобного текста, а не для проверки достоверности, они часто приводят сфабрикованные цитаты. Обеспечение соответствия ссылок реальным источникам имеет решающее значение. Заметное присутствие изготовленных изделий служит явным признаком участия искусственного интеллекта.

Поддержка принятия решений, включенная в отчет Ассистент по составлению отчетов с самого начала сформулирует суждения о работе. Рецензенты смогут задавать вопросы и получать целенаправленные ответы о сильных сторонах, проблемах и рекомендуемых действиях. Цель состоит в том, чтобы принимать решения, которые, как правило, удовлетворяют рецензентов, ускоряя при этом глубокий анализ.

Кому это выгодно: Образованию, научным исследованиям, библиотекам и промышленности Университеты, средние профессиональные учреждения и школы могут использовать Domate для обеспечения качества. Исследовательские организации, журналы и диссертационные советы могут проверять работы перед отправкой или публикацией. Библиотеки могут предоставлять читателям услуги по проверке. Отраслевые научные и корпоративные образовательные экосистемы могут интегрировать систему в своих организациях.

Широкий охват: Открытый Интернет, партнеры и локальные репозитории Поиск осуществляется по открытым интернет-источникам, партнерским/частным коллекциям и собственному репозиторию учреждения. В число партнеров входят крупные агрегаторы научных периодических изданий и издательства, такие как eLibrary и book publishers. Учитываются все соответствующие совпадения с индексацией по запросу, когда это необходимо. Выявление включает прямые совпадения, парафразы и переведенные заимствования.

Устойчивость к запутыванию при меньшем уровне шума и высокой скорости запоминания Система распознает различные методы маскировки – от замены кириллицы на латиницу до невидимых пробелов и разделения символов. Дублирующиеся источники и фрагментарные “мусорные” накладки устраняются, чтобы отчеты были удобочитаемыми. Повышается точность без ущерба для полноты, что позволяет легко находить подлинные источники. Четкие показатели (оригинальность, доля текста с искусственным интеллектом, доля совпадающего текста, самоцитирование, цитируемость), визуальная навигация и подробная панель источников упрощают просмотр с доступным демонстрационным доступом.

Помощь в борьбе с наказанием: Чистый и качественный поиск Цель состоит не в том, чтобы наказать или запретить, а в том, чтобы помочь и упростить работу. Система нацелена на высочайшее качество поиска с полным охватом, чтобы никогда не пропустить реальные источники. Каждый достоверный источник должен быть показан пользователю и включен в отчет. Чтобы отчеты были действительно полезными, они не должны содержать помех.

Ноль мусора как основной принцип Пользователи постоянно требуют удаления “мусора” из отчетов, и решить эту проблему сложно. Устранение нежелательной информации и ложного плагиата из результатов является главной целью. Надлежащая система предоставляет значимые доказательства и позволяет избежать беспорядка, который может привести к ошибочным решениям. Это обязательство определяет, как выглядит качество отчетности.

Целостность библиографии и фальсифицированные ссылки Работа с библиографиями особенно ценна для авторов и редакторов научных журналов. Основное внимание уделяется выявлению фальсифицированных ссылок и улучшению работы со списками литературы. Многие нерешенные проблемы в управлении библиографией были бы значительно улучшены благодаря надежным решениям. Ведется активная разработка, направленная на то, чтобы сделать этот инструмент более полезным.

Искусственный Интеллект Станет Основополагающим — Одних Процентов Недостаточно Искусственный интеллект становится основным инструментом, влияющим на многие области. Простое указание на студенческую работу доли “ИИ-текста” не дает никаких практических рекомендаций. Преподаватели справедливо спрашивают, что делать с такими цифрами. Использование инструментов ИИ по своей сути не ухудшает качество работы или образования; важны этика и контекст.

От выявления до руководства по решению реальных проблем Выявление должно указывать на конкретные проблемы, а не просто на количественную оценку участия ИИ. Если текст перефразирует существующий источник, этот источник должен быть показан, а зависимость - понятна. Если текст сгенерирован, поверхностен, повторяющийся или логически неполноценный, это слабое место должно быть подчеркнуто. Цель состоит в том, чтобы выявить проблемы, с которыми студент на самом деле не справился.

Защита авторов от несправедливых обвинений Детекторы могут выдавать ложные срабатывания, например, отмечать фрагменты, переведенные на машинный перевод, даже с правильными цитатами. Там, где использование искусственного интеллекта запрещено, такие случаи становятся особенно проблематичными. Долгосрочная цель ‑ сохранить поддающийся проверке цифровой отчет о том, как была подготовлена работа, чтобы подтвердить этичность использования инструмента. Эти данные должны учитываться при оценке как качества работы, так и качества образования.

От системы защиты от плагиата к более совершенной системе Основатель ранее помогал в создании Antiplagiat, но с тех пор ушел и не имеет к нему никакого отношения. После десятилетий роста этого рынка мы планируем использовать этот опыт для более эффективного обслуживания научно-образовательного сообщества. Это не шутка и не антимонопольный трюк, а серьезное, долгосрочное мероприятие. Цель состоит в том, чтобы создать систему оценки научных работ, которая превзойдет предыдущие решения.

Небольшая, целеустремленная команда и прагматичный подход к подбору персонала Команда представляет собой небольшой стартап без жестких корпоративных правил. Массового найма нет; подбор персонала осуществляется в соответствии с текущими потребностями в продуктах. Культурное соответствие и общий дух команды имеют большее значение, чем исчерпывающие контрольные списки. Люди подбираются в соответствии с миссией и темпами развития.

Цены, демонстрационные версии и гибкие контрольные квоты В настоящее время доступ предоставляется организациям, а предоставление услуг отдельным пользователям запланировано на начало следующего года. Потенциальные клиенты получают индивидуальные коммерческие предложения с помощью демонстрационных запросов по конкурентоспособным ценам. Условия разработаны таким образом, чтобы быть гибкими, включая порядок обработки неиспользованных или дополнительных чеков. Переговоры адаптируют условия к потребностям каждого абонента.

Институциональная свобода и информационно-пропагандистская деятельность Нормативные акты не предписывают какой-либо конкретной системы для выявления заимствований; организации могут выбрать любое решение. Качество должно быть проверено во время тестового доступа, а не предполагаться. Информация о системе доводится до сведения экспертных советов Высшей аттестационной комиссии и ведущих университетов. Признание достигается путем взаимодействия, а не через предписания регулирующих органов.

Приоритеты и охват индексации источников В отчетах преобладает открытый интернет-контент. Электронная библиотека, как правило, занимает второе место, за ней следует Российская государственная библиотека. Открытые проекты, такие как "КиберЛенинка", индексируются напрямую. Источники подписки, включая издателей и материалы библиотеки/RGB, добавляются по соглашению.

Иностранные базы данных в условиях геополитических ограничений Открытые зарубежные базы данных индексируются и включаются в поиск. Доступ по подписке к некоторым международным источникам сталкивается с геополитическими, а не техническими препятствиями. Контент открытого доступа будет по-прежнему доступен. Планируется расширение источников по подписке, но на это потребуется время.

Тезисы и институциональные хранилища Такие работы, как дипломные работы студентов и магистров, используются в собственных коллекциях каждого университета. Они также будут способствовать созданию общего академического индекса для всех учреждений. По мере подключения партнеров эти источники становятся доступными для поиска. Такая интеграция расширяет охват работ, размещенных на местном уровне.

На данный момент доступность ограничена в России и Беларуси Действующие контракты поддерживаются в России и Беларуси. Организации из других стран пока не могут быть подключены на стандартных условиях. Тем не менее, мы приветствуем запросы по электронной почте для изучения возможных решений. Поддержка поможет определить пути дальнейшего расширения.

Проверка отзывов и нижний предел для тестов искусственного интеллекта Рецензии могут быть проверены экспертами без ограничений по размеру. Практическое ограничение касается очень коротких текстов, в которых алгоритмы распознавания с помощью искусственного интеллекта работают плохо. Для проведения содержательного анализа объем рецензии должен составлять как минимум полстраницы, а многостраничные тексты также подходят. Короткие фрагменты дают слишком слабый сигнал для надежной оценки.

Механика обнаружения с помощью искусственного интеллекта, пределы проверки и цитируемость При обнаружении ИИ используются классификаторы машинного обучения, обученные на больших массивах текстов, созданных человеком, с особенностями, которые могут быть непрозрачными и частично отражаться в лингвистических частотных сдвигах. На практике детекторы фиксируют проблемное написание, в то время как хорошо обработанные тексты, созданные человеком, редко отмечаются. Многие издатели требуют, чтобы авторы сообщали обо всех используемых ИИ инструментах и их целях — от поиска информации и перевода до составления и стилистической коррекции. Не существует всеобъемлющего хранилища сгенерированных текстов, поэтому поисковики не могут предоставить неопровержимые доказательства авторства ИИ и вместо этого должны освещать реальные проблемы. Факторы цитируемости не используются в поиске, поскольку исследования не выявили устойчивой корреляции между тем, как часто цитируется статья, и тем, как часто копируется ее текст.