МЕТОДОЛОГИЧЕСКИЕ ОСНОВЫ ОЦЕНКИ КАЧЕСТВА ЭЛЕКТРОННЫХ УЧЕБНИКОВ ЕВРОПЕЙСКИХ ИНОСТРАННЫХ ЯЗЫКОВ

С.Ю. Агафонова, Д.В. Смолин

С 1997 года в АлтГТУ открыт лингвистический центр. Причиной создания центра послужила необходимость повышения уровня подготовки специалистов и перехода на многоуровневую систему высшего образования, что нашло отражение в изменении государственного образовательного стандарта.

В процессе становления многоуровневого высшего образования появился интерес к разработке и использованию новых интенсивных технологий обучения

В число интенсивных технологий обучения, которые получают все большее внедрение в учебный процесс, входят компьютерные технологии.

Использование компьютера позволяет существенно повысить уровень обучения, оптимизировать передачу и усвоение информации, освободить преподавателя от ряда трудоемких операций, обеспечить накопление передового учебно-методического опыта, создать возможность организации диалогового обучения для каждого обучаемого и адаптации процесса обучения к его индивидуальным особенностям, конкретным учебным ситуациям, а также активизировать самостоятельную работу обучаемых. В целях реализации программы по углубленной подготовке по иностранным языкам центр оснащен мультимедийными компьютерами, объединенными в локальную сеть с выходом в Интернет, функционирует система Тop School которая дает возможность преподавателю с экрана монитора своего компьютера наблюдать, контролировать и корректировать самостоятельную работу студентов.

Центр имеет в своем распоряжении комплекты мультимедиа-продуктов, электронных изданий, видеозаписей, аудиозаписей, методической литературы.

Свобода выбора учебных программ и пособий ставит перед преподавателем ряд достаточно сложных проблем — что необходимо для выбора конкретного программного продукта, как определить группу для дальнейшего обучения, как оценить достижения обучаемых за определенный срок, чего должен достичь обучаемый к концу обучения и т.п.

На практике каждый преподаватель проводит собственный анализ имеющегося ПО: формирует субъективную систему критериев и проводит оценку каждого продукта.

На наш взгляд необходимо выработать стандартный подход к оценке электронных учебников иностранного языка, что позволило бы сделать процесс выбора программного продукта объективным, в дальнейшем построить модель обучения и рассчитать оптимальные характеристики для отдельных специальностей, групп, студентов.

Структура электронного учебника

На сегодняшний день различают следующие виды программ:

Электронный урок – короткая компьютерная программа, посвященная изучению какой-либо минимальной темы, которую в силу малого объема или значимости для практического использования нецелесообразно или невозможно разделить на более мелкие составляющие.

Электронный учебник (ЭУ) – более крупная информационная единица, интегрирующая в себе несколько электронных уроков, обеспечивает достижение тактических целей обучения.

Электронный курс – функционально законченная крупная информационная единица, обеспечивающая достижение стратегических целей обучения.

Эл.курс = {ЭУ1,…, ЭУn}, ЭУ Î класс эквивалентных

ЭУ = {Урок1,…, Урокn}, Урок Î класс эквивалентных

Исходя из проведенного анализа существующих систем можно выделить следующие группы структур информационных единиц внутри электронного учебника:

    1. Линейная;
    2. Древовидная;
    3. Полносвязный граф.

Такие структуры соответствуют традиционным представлениям о программах обучения [1]. Эта модель может быть представлена графом, в частности типа "и - или".

Показатели качества электронных учебников.

К настоящему времени не существует устоявшейся системы оценки качества ЭУ. В различных работах предлагаются различные системы признаков и методов оценки, например [2]. По нашему мнению ЭУ необходимо оценивать исходя из телеологического подхода.

Основная характеристика учебника состоит в том, какие цели, насколько, за какое время, при каких затратах, при каких начальных условиях, в каком проценте и распределении случаев будут достигнуты. Все остальные характеристики (тип интерфейса, используемая лексика, реализуемая педагогическая теория и т.п.) являются либо второстепенными, либо подчиненными. Получаемые по этим показателям оценки следует рассматривать как статистические, по мнению авторов это очевидно. Оценка перечисленных параметров тесно связана с понятием степени достижения целей. Объективная оценка степени достижения поставленных целей может быть получена только методом тестирования. Важным вопросом здесь является вопрос точности измерения, поскольку при тестировании (исходя из теории измерения) мы уже неизбежно допускаем ошибку, а при обработке результатов - еще одну. Возникает вопрос, насколько правильными окажутся окончательные выводы вообще.

Для оценки качества электронных учебников мы предлагаем использовать следующие характеристики:

Валидность учебника (valid – способность удовлетворять чему-либо, допустимость). Будем различать

Содержательная валидность – оценивается экспертно и определяет меру соответствия содержимого учебника заявленным целям обучения. В данном случае имеется в виду в большей степени понятие объема знаний заложенного учебника, нежели структура этих знаний, поскольку, структура конкретного учебника строится исходя из конкретной психолого-педагогической теории, и эти теории часто противоречат друг другу.

Очевидная валидность – валидность с точки зрения обучаемого.

Сопоставительная валидность – сравнение с другими учебниками. Поскольку нет двух идентичных учебников, возможно имеет смысл рассматривать эту характеристику через соотношение достижения/затраты.

Надежность учебника

Надежность – способность учебника показывать одинаково стабильные результаты при применении на нескольких, но примерно одинаковых выборках. Способность учебника мало менять свою стабильность при применении на различных выборках. Стабильность сохранения основных параметров распределения результатов после применения этого учебника на разных группах.

Трудность учебника

Характеризует затраты на обучение по данному учебнику – временные, материальные, умственные, физические и т.п.

Экономичность и избыточность учебника

Способность достигать поставленных целей за минимальное число шагов. Характеризуется распределением числа шагов, необходимых для достижения поставленных целей в разных выборках. Избыточность учебника – мера наличия в учебнике такой информации, овладение которой прямо не служит достижению поставленных целей обучения.

Интегрированность учебника — степень его интеграции с другими учебниками.

Практичность учебника. Оценивается экспертно или по затратам времени или по отзывам обучавшихся по критерию знаков.

Связность учебника — статистическая мера связи между уроками в учебнике – насколько они являются независимыми.

Какие цели достигнуты

На рис. 1 (достигнута цель С) достигнута именно цель С,поскольку ее дисперсия меньше или равна допустимой, а для цели D дисперсия больше допустимой. Признак в выборочной группе является дихотомическим "0-1", "достиг-не достиг". Решение о том, достиг или не достиг принимается из граничного значения или градаций, закладываемых в тест (например, 0.7-1). На оси Y – количество "сдавших" на уровень.

 

Степень достижения достигнутых целей.

Это есть суть результата сертификационных экзаменов на уровень С. Здесь по оси Y – количество получивших заданную оценку при сертификации на уровень С.

Обобщенная характеристика “Какие цели и насколько достигнуты ?”

 

В данном случае получим пространственный график – некоторую криволинейную плоскость, ландшафт. Такой ландшафт можно просмотреть и в динамике, например, по группе – чего и в какой мере она достигала за время своего существования.

Затраты на достижение цели (уровня)

Затраты по меньшей мере двух видов: временные и материальные (например, на распечатку)

По оси Y – “достиг-не достиг” = {0,1}. Здесь имеет смысл следующая характеристика: динамика временных затрат на достижение цели (например, цели С) в ее (цели) минимальной конфигурации (определить по градации тестов), что позволяет сделать выводы:

Для достижения уровня С "вообще" лучше учебник В1, а для хорошего достижения того же уровня лучше учебник В2. Учебник В3 быстро доводит до мин. знаний по уровню С, а до максимальных знаний по тому же уровню ведет долго, а вот учебник В4 – наоборот. По результатам оценки должен формироваться вербальный вывод – данный учебник предназначен для лиц с высокой скоростью усвоения, отличной памятью и т.п.

Направленность учебника

Такая характеристика как "На кого рассчитан учебник" должна следовать из вида распределения его результатов. Распределение может быть смещено в сторону "сильных" студентов или "слабых", "медленных" или "быстрых", "все помнящих" или "быстро забывающих", так вот вид кривой распределения как раз и должен характеризовать требуемый начальный уровень подготовки. Вообще, делить студентов на “слабых” и “отличников”, имеющих большой и малый объем знаний – не совсем верно. Еще следует учитывать потенциальные возможности и скорости прогресса данного обучаемого. Один и тот же обучаемый в разные моменты времени находится в разном психофизиологическом состоянии и его способности могут различаться значительно. Равное, а может и большее значение имеет не само обладание чем-то, скорость восприятия и возможность восприятия.

Аналогичные характеристики можно сопоставить и каждому из уроков учебника, что позволит производить анализ элементов учебника, а оценка учебника в целом позволяет получить анализ эффективности структуры уже этих самых уроков.

Основные показатели качества уроков в учебнике

Какую цель достигает и насколько, затраты, связность , избыточность, необходимость урока.

Связность и избыточность и необходимость урока.

Необходимость – если урок вообще выбросить – каков будет результат по данной цели, не обучится ли слушатель как-нибудь на других уроках, для этого специально не предназначенных.

Избыточность – нет ли в уроке чего лишнего, и если есть то какова мера. Избыточность – попытка достичь в уроке несколько разнородных целей, предъявить несколько не связанных единой целью информационных единиц, например, грамматику и страноведческую информацию или наличие материала (картинки, например) вообще без четкой цели.

Избыточность можно оценить через средние характеристики (время внимания и тп).

Избыточная информация – это та, добавление которой уже не приводит к росту оценки по тесту.

Связность – мера связи с другими уроками. Для тестов – это корреляция между результатами некоторых двух заданий. Для учебников, видимо, нечто подобное, т.е влияние одного урока (усвоения) на способность усвоить другой. Для тестов связь между заданиями – это плохо. Для уроков – видимо, исходя из педагогической концепции. Для учебника связность – хорошо, а для справочника – плохо. Связность – корреляция между результатами тестов по этим самым урокам. Связность можно представить матрицей парных корреляций, хотя в общем случае нужен конечно ПФЭ.

Алгоритм расчета основных характеристик качества электронного учебника

В качестве примера рассмотрим алгоритм расчета сопоставительной валидности. Задача выяснения валидности сводится к задаче сравнительного анализа распределений до и после применения учебника на некоторой группе. В случае, если речь идет о нормальном распределении, то надо доказать, что математическое ожидание значимо изменилось. Если распределение другого вида или приняло другой вид после применения, то необходимо попытаться привести его к нормальному (например, логарифмическим преобразованием, либо путем структурных изменений самого учебника на основе анализа вида распределения). Если и это не удается, то необходимо рассчитать ранговую корреляцию, определить вид распределения и интерпретировать его (распределение) вербально. Необходимо учитывать, что оценка учебника в общем случае величина многомерная, поскольку учебник преследует не одну, а сразу несколько целей. В общем случае (чаще всего) результаты применения учебника могут представляться следующими кривыми:

Равномерное распределение – идеальный вариант, который однако не встречается на практике

Нормальное распределение – вариант, чаще всего встречающийся на практике. Вид распределения говорит о том, что учебник рассчитан на среднего студента.

Распределение Пуассона, Распределение Максвелла, Распределение Шарлье – учебник рассчитан на обучаемого, отличающегося от среднего. Например – интенсивный курс, напротив – ознакомительный курс и тп.

Таким образом, в математическом смысле ставится задача статистической проверки нулевой гипотезы, и в случае, если гипотеза будет отвергнута, – оценке степени различия выборок. В различных областях приняты различные методики проверки данной гипотезы. Для большего числа областей уровень ошибки принимается 1% или 5%, в некоторых областях, например, в социологии, используется уровень значимости 50%.

Проверка нулевой гипотезы в случае нормального распределения

Для сравнительной оценки средних величин в случае нормального распределения применяют t-критерий Стьюдента (Госсета). Для оценки дисперсий используется F-критерий Фишера.

Проверка нулевой гипотезы в случае распределения, отличного от нормального.

Необходимость применения параметрических критериев для проверки статистических гипотез возникает тогда, когда наблюдаемые признаки распределены отлично от нормального, либо если признаки являются не количественными, а качественными (выражены порядковыми номерами, индексами, условными знаками и тп) [3]. Существует целый ряд непараметрических критериев, среди которых видное место занимают так называемые ранговые критерии.

Критерий знаков z

X-критерий Ван-дер_Вардена.

U – критерий Уилкоксона (Манна -Уитни)

T – критерий Уилкоксона

Проверка гипотез о законах распределения.

Проверка при помощи коэффициентов асимметрии и эксцесса.

Критерий ХИ-квадрат

Критерий Ястремского J

Применение элементов корреляционного анализа для оценки качества ЭУ.

В случае, если нулевая гипотеза отвергнута, необходимо выразить оцениваемую характеристику численно. Такую оценку можно получить, используя, например, элементы корреляционного анализа.

Коэффициенты корреляции.

Коэффициент корреляции — отвлеченное число rÎ [-1,+1],

R = 0, связь между признаками отсутствует

R = +1, полная положительная связь (возрастанию X соответствует возрастание Y)

R = -1, полная отрицательная связь (возрастанию X соответствует убывание Y)

В таблице приведены некоторые часто используемые коэффициенты корреляции.

Коэффициенты корреляции

Параметрические

Непараметрические

Пирсона

Ранговые

Бисериальные

Пирсона

Фи-

коэфф.

Спирман, Кэндл

 

Параметрические – зависят от характера распределения, в формуле есть характеристики распределения, например, s , и тп. На практике разработаны только для нормального распределения.

Непараметрические – (ранговые-частный случай) – не зависят от закона распределения

СПИСОК ЛИТЕРАТУРЫ

1. Ю.Н. Кушелев Технические средства обучения и контроля. М., “Высшая школа” 1973,-191 с.

2. М.А. Бовтенко Теоретические основания лингвометодической оценки качества программного обеспечения языку. Диссертация на соискание ученой степни кандидата филологических наук. Новосибирск 1998.

3. Г.Ф. Лакин. Биометрия Москва., “Высшая школа” 1990,- 351 стр.