Студенческий сайт КФУ - ex ТНУ » Учебный раздел » Учебные файлы »ПРОГРАММИРОВАНИЕ

Автоматизация процесса поиска плагиата

Тип: курсовая работа
Категория: ПРОГРАММИРОВАНИЕ
Скачать
Купить
Разработка системы по поиску плагиата среди работ студентов. Получение оценочной информации о работе и коэффициенте плагиата. Повышение эффективности оценивания работы студента. Информационное обеспечение системы. Выбор устройства управления данными.
Краткое сожержание материала:

Размещено на

Содержание

  • Введение
  • 1. Техническое задание на разработку системы
  • 1.1 Назначение и цели создания системы
  • 1.2 Характеристика объекта компьютеризации
  • 1.2.1 Описание структуры и процесса функционирования объекта
  • 1.2.2 Существующая информационная система
  • 1.2.3 Обоснование необходимости в разработке системы
  • 1.3 Требования к системе в целом
  • 1.4 Требования к функциям системы
  • 1.4 Требования к видам обеспечения
  • 1.5.1 Требования к техническому обеспечению
  • 1.5.2 Требования к программному обеспечению
  • 2. Функциональная структура подсистемы
  • 1.2 Учет работ
  • 1.2 Обнаружение плагиата
  • 1.3 Формирование отчетности
  • 2. Информационное обеспечение системы
  • 2.1 Выбор устройства управления данными
  • 2.2 Разработка моделей данных
  • 2.3 Организация сбора и обработки информации
  • 3. Математический аппарат подсистемы
  • 3.1 Учет работ
  • 3.2 Обнаружение плагиата
  • 3.2.1 Основные понятия
  • 3.2.2 Алгоритмы для обнаружения плагиата
  • 3.4 Формирование отчетности
  • 4. Программное обеспечение системы
  • 4.1 Структура и функции частей программного обеспечения системы
  • 4.2 Разработка специального программного обеспечения
  • 5. Техническое обеспечение системы
  • 5.1 Выбор конфигурации параметров сервера
  • 5.2 Выбор конфигурации параметров рабочей станции
  • 5.3 Выбор периферийных устройств
  • 6. Организация компьютерной сети
  • 6.1 Выбор и обоснование технологии передачи данных
  • 6.2 Выбор сетевого оборудования
  • Заключение
  • Приложение А - Функциональная структура системы
  • Приложение Б. Схема данных БД университета

Введение

Внедрение IT технологий и автоматизации в сферу образования, в частности, в ВУЗы несет в себе много пользы, но так же появляются очевидные минусы, такие как плагиат. Проблема плагиата заключает в себе вопрос об интеллектуальной собственности, следственно, для разделения собственности необходим инструмент, позволяющий определить плагиат. Плагиатом является присвоение чужой собственности себе, в данном случае - программный код.

Маленькое количество учебных заведений может похвастаться большим и богатым инструментарием для повышения уровня оценивания работы студентов. Иными словами, без необходимых инструментов преподаватель не в состоянии поставить объективную оценку студенту. Так же основной идеей обучения в университет является получение навыков, понимание принципа обучения в данной области, а касательно области IT технологий главной идеей является развитие логического мышления в ходе выполнения работы. Работы, касающиеся разработки программного обеспечения вырабатывают математическое мышление. В случае плагиата программного кода, человек теряет возможность к обучению, не учит ничего нового.

К сожалению, преподаватель не в состоянии разработать задания к лабораторным работам в размере 100 штук, чтобы каждая работа была уникальной, но в тоже время была четко направлена на изучение данного алгоритма, синтаксического приёма языка программирования. С увеличением количества заданий теряется качество задания и зачастую выходит так, что преподаватель принимает большее участие в решении лабораторной нежели студент (объяснение идеи лабораторной работы). Для достижения максимальной целенаправленности и целостности задачи - количество задач уменьшается до минимально допустимого уровня, а варианты разбрасываются на несколько студентов. Чтобы оценить работу студентов сначала необходимо сравнить работы по одинаковому заданию - найти в них схожести и только после этого проверять саму работу. Для увеличения производительно и скорости поиска плагиата разрабатывают специальные системе по поиску плагиата, чтобы максимально автоматизировать процесс и выиграть больше времени на живое общение со студентом.

1. Техническое задание на разработку системы

1.1 Назначение и цели создания системы

Главным оценочным фактором работы студентов является преподаватель. Он играет немаловажную роль при оценивании работы студента и проверке в усвоении материала. Приложение усилий для решения поставленной задачи, она же проблема, является неотъемлемой частью, т.к. выполнение задание направлено на поиск и обработку информации, что развивает логическую деятельность и самостоятельность к обучению. Преподаватель тоже человек и физически не способен обработать 100 заданий с одинаковой структурой в реализации. В данном случае возникает необходимость автоматизировать целостность работы и программного кода, чтобы увеличить качество оценивания.

Назначение такой системы заключается в определении авторства работы студента, которая обеспечивает поиск плагиата кода среди имеющихся работ студентов и накоплении работ. Поиск основывает на алгоритмах-детекторах кода в заданном языке программирования.

Целями создание компьютеризированной системы являются:

Получение оценочной информации о работе и коэффициенте плагиата

Повышение эффективности оценивания работы студента;

1.2 Характеристика объекта компьютеризации

1.2.1 Описание структуры и процесса функционирования объекта

Основным объектом компьютеризации является процесс принятия работы. Процесс принятия представляет собой 3 этапный механизм в сочетании с человеческим фактором (Рис 1.1). Где 1-ый этап это добавление работы в систему (регистрация), в качестве второго этапа выступает анализ работы и выявления плагиата. 3-ий этап является обязательным, даже при 100% -ном прохождении работы через систему.

Рисунок 1.1 - Процесс принятия работы.

1.2.2 Существующая информационная система

Конкретной существующей системы, которая выполняла поставленную задачу не было обнаружено, поскольку в рамках учебного заведения системы создаются студентами/аспирантами и не попадают в публичный доступ. Но существуют подсистемы, которые выполняют конкретную отточенную функцию - поиск плагиата. Список существующих подсистем представлен ниже:

1) SIM (Software Similarity Tester) - детектор с открытым кодом, разработанный Диком Грюном (Dick Grune). Работа детектора SIM основывается на алгоритме поиска по матрице совпадений подстрок; используется представление программного кода в виде токенов. SIM поддерживает такие языки программирования как Си, Ява, Паскаль, Модула-2, Миранда. Недостатком данного детектора является невозможность выявления плагиата, полученного путем перемещения блоков кода.

плагиат оценочная информация поиск

2) Plan-X - детектор с открытым кодом; разработан Кристой Фотель (Christa Fotel) и Ларсом Лэнжером (Lars Langer). Для поиска плагиата в детекторе используется утилита для работы с XML файлами - XML Store. Plan-X поддерживает только язык SML, что и является недостатком этого детектора.

3) JPlag - детектор, доступный в режиме он-лайн. Разработчиком является Guido Malpohl. В основе работы детектора лежит алгоритм жадного строкового замощения, что требует предварительной токенизации исходного программного кода. Jplag поддерживает следующие языки программирования: Си, Си++, Ским (Scheeme), Ява.

4) MOSS (Measure of Software Similarity) - детектор, доступный в сети Интернет в режиме он-лайн. Разработан в 1994 году Алексом Айкеном (Alex Aiken). Для поиска плагиата используется алгоритм просеивания для построения идентификационных меток. Поддерживает большое количество языков, в частности: Си, СИ++, Лисп, Хаскель, Паскаль, Пижон, Ассемблер и др.

5) SID (Software Integrity System) - доступный в режиме он-лайн детектор, разработан коллективом авторов: X. Chen, B. Francia и др. Основан на использовании Колмогоровской сложности, требует предварительной токенизации текста программы. Поддерживает языки Ява и Си++.

1.2.3 Обоснование необходимости в разработке системы

Зачастую, проблема таких подсистем заключается в их недоступности, несовместимости для интеграции или же недопустимых требованиях. Таким образом в рамках разработки системы появляется необходимость создания собственной подсистемы обнаружения или же частичной интеграции существующих частей кода и пользовательской реализации остальных частей системы для реализации.

1.3 Требования к системе в целом

Система по поиску плагиата в программном коде должна автоматизировать обнаружение плагиата в программном коде, его модулях и бинарных файлах. Также система должна обеспечивать конфиденциальность данных и имеющихся в ней модулей и централизованную сохранность данных системы.

Система должна состоять из 2 блоков:

· Блок коммуникации с пользователем (клиент)

· Блок интеграции (серверная часть)

1.4 Требования к функциям системы

Система должна выполня...

Другие файлы:

Программная реализация модуля PlagiatSearch поиска плагиата методами сравнения произвольных текстов
Специфика понятия "плагиат" в программировании. Схема работы модулей инструментальной системы поиска плагиата. Основы поиска в исходных кодах программ...

Плагиат в авторском праве
Понятие плагиата, историческое развитие этого явления и изменение общественного отношения к нему. Классификация видов плагиата в авторском праве, проб...

Автоматизация учета трудоустройства выпускников для УО "Белоозерский государственный профессионально-технический колледж электротехники"
Автоматизация процесса учета распределения специалистов УО "Белоозерский ГПТК электротехники" для облегчения поиска выпускников определенного года вып...

Автоматизация процесса контроля и регулирования установок
Анализ хозяйственной деятельности, технического и программного обеспечения ООО НПФ "Интек". Полная автоматизация настройки контроллеров, предназначенн...

Автоматизация процесса дистилляции тетрахлорида германия
Технологическая схема процесса и общий принцип получения полупроводникового германия из германиевых концентратов. Основные способы очистки техническог...