Про неверные обобщения
Aug. 9th, 2016 04:42 am![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Есть такая изумительная и активно цитируемая работа о шестикласснике Бенни, который вывел собственный набор правил для прохождения школьных тестов по простым дробям. Любопытно, что Бенни демонстрировал прекраснейшие результаты, наглухо не понимая, что такое дроби.
http://www.wou.edu/~girodm/library/benny.pdf
Что особенно любопытно, правила Бенни более-менее чёткие, хотя выглядят они дико. Ещё более любопытно, что если выкинуть подлежащую математическую абстракцию, его схема манипулирования символической системой из чисел, точек и горизонтальных линий ничем не хуже любой другой, дающей на такой же выборке аналогичную плотность правильных ответов.
Китайская комната, во всей красе.
Бенни описывает свои ощущения от тестов как wild goose chase, на русский я бы это перевёл как “бесполезная движуха”. То-есть это такая игра, в которой основной результат вовсе не понимание, а проходной балл. Иными словами, основной стимул – как можно быстрее дать правильный ответ.
Забавно, что даже изучения корректных школьных правил операций с дробями вполне соответствует этому описанию. Простые дроби как понятие настолько шире того, что изучается в школе, что я до сих пор не могу сказать, что понимаю их роль в окружающей реальности с устраивающей меня полнотой. Восприятие дробей как просто способа записи рациональных чисел вообще невыносимо куцее.
Набрёл я на этот пример с правилами Бенни в рамках диалога и размышлений о подходах работы абстрактного генератора программ по нечёткому заданию.
Затрудняюсь точно описать выводы. Как минимум, теперь я уверен, что подход, связанный с “охотой” на решение, выражаемое в рамках замкнутой символической системы, не очень то уместен как генерализованный для нейросетей.
Несмотря на такую “не совсем подходящесть”, люди этот способ применяют повсеместно – и весьма в целом успешно. И я никак не могу придумать хотя бы намёк на метод, позволяющий отделять задачи, к которым можно с приемлемой вероятностью получить ответ таким способом, от задач, к которым этот способ неприменим совсем.
Понятно, что способ начинает давать ложные результаты при расширении выборки – но мы склонны патчить имеющиеся правила (как Бенни), а не искать более общую закономерность.
Ну и related video вот, Алан Кей рассказывает про важность простоты. Там в начале хороший пример в тему – про Птолемееву систему мироустройства.
no subject
Date: 2016-08-11 12:11 am (UTC)Если заниматься вот таким детальным буквоедством, то ньютоновская механика это тоже не реальный мир. Это абстрактная модель для описания определённых аспектов реального мира, позволяющая формализовавать некоторые наблюдения и позволяющая делать вычисления, которые с некоторой погрешностью (в некоторых случаях с неприемлемо большой, а в некоторых с пренебрежимо малой) предсказывают проекции будущих наблюдений на эту модель (или угадывать прошлые). Т.е. у неё есть "область применения".
Физический процесс в реальном мире - это, вот, я наливаю молоко в кружку. Любая формализация этого процесса это уже проекция на абстрактную модель. Можно описывать этот процесс в разных моделях, в том числе как ньютоновский процесс (масса молока меняет свои координаты в пространстве под действием гравитации), но и во многих других моделях.
Перестановка предметов/объектов/чего либо - это тоже физический процесс (мы не говорим про ньютоновскую физику, а про вообще физический мир, реальность). Беру предметы на столе и переставляю. Произошло. Другие люди смогли понаблюдать! Вот вероятность - это уже абстракция. Она основана на реальной или гипотетической возможности повторить перестановку много раз. В этом случае можно сделать ряд наблюдений и предположить, что позиция предмета равновероятна. В этот момент уже можно поговорить, например, о множестве всех возможных перестановок. Да, это абстракция, но это довольно близкая к реальности абстракция: до эксперимента рукой подать. Например, я могу по-разному переставлять предметы на столе, фотографировать результаты и соотносить фотографии, отбрасывая повторные (с точностью до порядка предметов). Я могу соревноваться с кем-нибудь на тему "кто соберёт больше разных фотографий", и какой вообще предел этого количества.
Число N!, определяемое через произведение (1*2*...*N) это куда более оторванная от реальности абстракция. Целые числа это абстракции, операция умножения это абстракция, и перемножение этих чисел это большая громоздкая абстракция.
И где мы этим понятием оперируем в школьной ньютоновской физике? А в школьной (именно школьной) геометрии? А в школьной логике?
В школе есть комбинаторика, есть линейная алгебра (матрицы, детерминант - там тоже перестановки). Конечно, это не много, но я привёл перестановки просто как пример определения математического понятия через физику процесса.
Конкретно для школы куда ближе подойдёт пример с квадратными трёхчленами. Я впервые столкнулся с ними, когда решал задачу по физике, забегая вперёд по программе. У него совершенно ясный физический смысл - выражение расстояния через время при постоянном ускорении (в этом случае берём конкретно ньютоновскую механику). Потом уже я решал многие другие (изоморфные) задачи, и нашёл больше применений квадратному трёхчлену, но когда мы проходили по алгебре квадратные уравнения, я чётко воспринимал их как инструмент для решения таких-то задач. Мне не нужно было зазубривать, куда там в каком случае направлены ветви параболы, потому что мне очевидно: для меня коэфициенты трёхчлена наполнены физическим смыслом. Многие мои одноклассники этого физического смысла не видели, потому что им не повезло осваивать именно в такой последовательноти. Соответственно, для них это была просто игра с символами. Так, какое там было правило? (- b +/- sqrt(b*b-4ac)) / 2a, ок, подставляем, решаем. Подставляем ответы, проверяем, да, действительно это корни. А в чём смысл? Давайте дети, сегодня проходим решение графическим методом. А что, можно было и так решать? (А зачем ещё этот другой метод?). И т.п.
no subject
Date: 2016-08-11 02:03 am (UTC)Я утверждаю, что ты не сможешь дать определение факториала через школьную физику. Его надо вводить отдельно. Хочешь попробовать опровергнуть – опровергай, только у тебя не получится.
Школьная физика, Дима, – это наука о результатах измерений. В перестановках одинаковых объектов нет такой физической величины, которую ты бы мог измерить.
От того, что ты в замкнутой системе из одинаковых покоящихся относительно друг друга объектов виртуально перенумеруешь объекты, измеряемые свойства системы не изменятся.
Если ты их будешь перемещать с позиции на позицию (а не просто виртуально перенумеровывать), все возможные начальные и конечные состояния любого такого процесса перемещения будут с тз школьной физики совпадать вне зависимости от того, как именно ты объекты перемещаешь (по каким траекториям, с какой скоростью и пр). Эти состояния с тз школьной физики неразличимы.
Возможно, ты по пути докажешь закон сохранения энергии и момента импульса, но то, что перестановок именно n! ты формулами школьной физики не докажешь. (Под формулами школьной физики я подразумеваю такие, в которых у единиц есть размерность, то-есть присутствуют физические величины).
> выражение расстояния через время при постоянном ускорении
В самом деле квадратный трёхчлен – частный простейший случай дифура второго порядка (расстояние' это скорость, расстояние'' это ускорение). Как правило, школьные задачи подбирают так, чтобы они сводились к линейному однородному дифуру второго порядка, потому что тогда возможно аналитическое решения.
Так что для тебя (и для меня) это было тоже не больше чем просто игра с символами, просто в символах нам чуть больше виделось смысла, чем менее догадливым одноклассникам. Тем не менее общий смысл (что это всё можно проинтегрировать вне зависимости от характера движения – и если ты смог проинтегрировать аналитически, ты сразу получаешь решение) из школьных задач вообще говоря с очевидностью не следует, тут надо поглубже понимание.
Факториал в школьных простых случаях (которые квадратные трёхчлены) не вылезает. В более сложных и тем более генерализованных случаях гамма-функция у тебя там почти непременно полезет откуда-нибудь, конечно, – но мы то не про более сложные случаи говорим. Да и гамма-функция – это колоссально более сложное понятие, чем факториал.
---
Итого: да, я согласен, что многие штуки в школе имеет смысл начинать объяснять с простой физики, геометрии и логики, но чтобы не ограничиваться самыми примитивными частными случаями, надо к этой системе добавлять понятие факториала.
Как именно ты будешь объяснять, что это такое, не очень важно, но важно то, что без выхода за пределы школьной геометрии, физики и логики у тебя объяснить не получится.
no subject
Date: 2016-08-14 07:56 am (UTC)Почти. Физика это наука о законах природы. "Закон природы" это некоторое описание механизма (модель), которая должна непротиворечить результатам измерений, и с помощью которой можно предсказывать будущие результаты измерений. Пресказательная сила - это важнейшее свойство, без неё можно по любым датапоинтам построить интерполяционный многочлен N-й степени, в который впишутся все прошлые измерения, но он не будет нести какой либо смысл именно тем, что ничего не сможет предсказать. Кроме того, промежуточные измерения, которые не были учтены в интерполяции, почти наверняка в него не впишутся.
Я хочу акцентировать на том, что физика это не просто "про измерения". Это и "про модели" тоже. Модели - это абстракции, математические модели.
В перестановках одинаковых объектов нет такой физической величины, которую ты бы мог измерить.
В перестановках вообще - действительно нет, потому что это абстракция. А в конкретном примере, что я описал (вот они мои 10 предметов в указанных позициях, и вот я их переставляю), конечно же есть. Есть координаты каждого предмета в пространстве. Их можно измерить, и можно строить модель, предсказывающую.
Конечно, физика тут несколько притянута за уши, потому что ОБЫЧНО мы пытаемся описать ПРОСТЫЕ физические процессы (скажем, тело, свободно падающее в пространстве и т.п.), а не результаты наблюдений за сложными механизмами (представим себе робота, переставляющего предметы). Обычно мы пытаемся абстрагироваться от посторонних сил. Тем не менее, измерения есть, модели есть.
Впрочем, физичность примера с перестановками не в том, что он хороший пример физического процесса (он отвратительнейший пример), а в экспериментальном аспекте. Я могу наблюдать. Я могу ставить эксперимент. Т.е. абстракция модели проста благодаря тому, что довольно просто симулировать процесс, в результате которого появляются описываемые моделью объекты.
Если ты хочешь более классический пример физического процесса, в моделировании которого вылезут факториалы, нужно брать молекулярный уровень (где будет статистика, или атомы-электроны-потенциал, или волны, колебания), или же макро-процессы, которые описываются простой формулой, но эту формулу можно вывести через молекулярный уровень. Я не настолько ориентируюсь в физике, чтобы построить тебе хороший пример прямо сейчас, но если бы я пытался его построить (и так, чтобы это была именно школьная физика), я бы посмотрел газы, звук, электричество или маятники. В чём-то из этого наверняка статистика всплывёт естественным образом, а за ней и перестановки/факториалы.
но то, что перестановок именно n! ты формулами школьной физики не докажешь.
Тут какая-то путаница вышла. Я не собирался доказывать, что перестановок именно n!. Я лишь указал на то, что можно перестановки сделать первичными, и взять их количество за определение факториала. Т.е. сказать "давайте определим n! как количество разных перестановок n предметов". В этом случае то, что n! = n * (n-1)! уже нужно будет доказывать (в противоположность классической теории, где n! = n * (n-1)! берут по определению, а потом доказывают, что количество перестановок равно n!). Что именно брать по определению, а что доказывать - вообще говоря, произвольный выбор. Возвращаясь к моим изначальным комментариям, моя мысль была в том, что если определяющим выбирать физический процесс, то для обучения это лучше. Это лучше, потому что физическую модель можно "пощупать руками", смоделировать, провести физические эксперименты. Это проще, чем проводить мысленные эксперименты с новыми абстракциями. По крайней мере, для школьника.
no subject
Date: 2016-08-15 05:04 am (UTC)Я недостаточно корректное слово употребил. Не доказывать, а вывести, конечно. Нет, не сможешь.
> Я не настолько ориентируюсь в физике
> я бы посмотрел газы, звук, электричество или маятники
Зато я прекрасно ориентируюсь ) Твои догадки, куда надо смотреть – они, в общем, верные – вот только если ты действительно попробуешь это сделать, ты будешь удивлён. Возможно, даже очень удивлён.
Я сделаю несколько подсказок на условно простом примере, который несложно представить. (Прошу понимать, что текст дальше – это сильное упрощение и огрубление).
Давай возьмём набор из достаточно большого количества шариков одинаковых размеров. Пусть, для простоты, это будет бильярдный стол, но без лунок. Для ещё бóльшей простоты пусть шарики, когда перемещаются, не крутятся – чтобы исключить некоторые степени свободы. То-есть, превратим шарики в плоские диски – как в аэрохоккее.
Мы даже ещё упростим. Мы сделаем наш стол круглым и такого диаметра, что его можно плотно равномерно дисками замостить. Также мы выкинем единственную оставшуюся вращательную степень свободы – предпложим, что о стенки и друг о друга диски ударяются абсолютно упруго, без трения.
Если подумать, в какой размерности пространстве в самом деле живут эти диски, если они не покоятся (без вращательной компоненты), ты придёшь к удивительному на первый взгляд выводу. Это пространство – нецелой размерности.
Причём чем больше будет дисков на столе, тем меньше двух будет получаться размерность. Если ты замостишь стол полностью, у тебя останется только одно измерение (одновременно повернуть весь массив дисков).
Физический смысл тут довольно просто представить – равномерно вначале движущийся диск пройдёт совсем не то расстояние (не путь, а именно расстояние, а ещё точнее перемещение), которое нам предсказывает школьная механика. Перемещение будет меньше, потому что, упрощённо говоря, нашему диску доступны не все направления движения. Он живёт не в двумерном пространстве.
Как только ты попробуешь применить к нашему диску школьные формулы, ты неожиданно обнаружишь, что не можешь этого сделать – тебе станут нужны какие-то очень странные сущности, типа «нелинейного» времени или пространства. И как только ты это поймёшь, тебе быстро захочется в уравнении движения иметь не только, скажем, первую и вторую производные – а ещё, условно, «полуторные» (нецелые).
И только ты начнёшь решать всю эту кухню, практически любым из способов из обычной программы универа, ты обнаружишь, что тебе нужны производные всё более и более высоких порядков, чтобы учесть вклад некоего параметра, характеризующего связность системы. Также ты быстро заметишь, что на каждом шаге в знаменателе ты будешь получать число, равное произведению предыдущего знаменателя на номер шага.
Это у тебя вылезла гамма-функция. Она, в некотором смысле, характеризует и обобщает понятие связности элементов динамической системы.
----
Теперь примени тот-же подход для систем, живущих в пространстве с целой размерностью – то-есть школьные, несвязные или абсолютно связные системы. Ты быстро обнаружишь, что генерализовать факториал не получается – тебе не сделать больше определённого, конечного и весьма небольшого количества шагов (сопоставимого с к-вом элементов системы, а гораздо чаще – и вовсе с к-вом измерений), потому что числители начнут обращаться в ноль.
Также ты обнаружишь, что для иллюстрации «следующего» целого факториала тебе придётся придумывать всё более сложный и искусственный пример, а потом очень длинно объяснять свои манипуляции и их физический смысл.
Я не вижу, как таким дидактическим подходом можно что-то вывести обобщённо. Несопоставимо проще ввести факториал напрямую через нефизическое понятие перестановок, затем ввести вероятность, а потом показать её физический смысл на примерах.