Образование и теорема Байеса
Feb. 13th, 2010 05:35 pm![[personal profile]](https://www.dreamwidth.org/img/silk/identity/user.png)
Тут опять в камментах к посту service_picky пролетела мысль, которую у меня возникло желание развернуть. Сервис-пики утверждает, что у каждого есть возможность создать бизнес нацмасштаба.
Я вот так не считаю. Я бы сказал, что каждый может с ненулевой вероятностью создать такой бизнес, но для большинства вероятность таки приближается к нулю и делает попытку создать такой бизнес неинтересной. И вот почему.
Я полагаю, что к появлению предпринимателя определённого масштаба приводит довольно большой, но всё же ограниченный набор причин. Сложно предположить слёту, что это за причины, каково их взаимовлияние и какие у них “веса” в общем результате. Тем не менее, я верю в причинность в физическом смысле – и уверен, что набор факторов можно определить.
Есть такая замечательная теорема Байеса, которая в наше время используется настолько повсеместно, что даже лень об этом писать подробно. Скажем, все эффективные спаморезки используют эту теорему. Если говорить грубо, теорема Байеса позволяет по уже имеющемуся событию посчитать вероятности причин, которые к нему привели.
Было бы забавно провести глобальный эксперимент – мониторить централизовано школьников по большому набору параметров. Начиная от оценок их самих и их окружения (ровесников) и заканчивая успехами их родителей на работе. Книжки, что читают эти школьники; сайты, куда они ходят; фильмы, что они смотрят; статистики районов, где они живут; цены на еду, что они едят и т.д.
А потом, скажем к 25-30 годам, оценить, что получилось и построить байесову сеть, которая позволит следующим поколениям школьников получать всё более точные рекомендации по поводу выбора своего будущего.
То-есть, это как-бы проверка алгеброй божьего промысла.
Идея, в общем, не нова – и её легко довести до абсурда (у Азимова есть рассказик “Профессия”, тамошняя система раздачи профессий – наверняка байесова сеть). Тем не менее, мне было б чрезвычайно любопытно посмотреть, что же приводит к появлению бизнесов нацмасштаба.
Вообще, кто-нибудь слышал про применение сетей Байеса в оценке перспектив в образовании? А?
no subject
Date: 2010-02-13 03:13 pm (UTC)но мне всё-таки кажется, что процент Случая и/или срабатывания зверской интуиции просчитать очень трудно, а их влияние трудно отрицать.
что касается нацбизнесов - то я совершенно не согласна с тем, что все на это способны. меньшинтсво могут хотя бы школу окончить из собственных побуждений, а не потому что родители сказали. во взрослой жизни процент самомотивированных людей увеличивается, но не слишком значительно.
no subject
Date: 2010-02-13 03:38 pm (UTC)одних оценок для вычисления "предназначения" конечно мало. но байесовы сети тем и хороши, что дают вероятностные прогнозы при неполноте вводных. просто сейчас этого не делается -- а вполне можно было б уже.
мне кажется почему то, что даже по одним оценкам и тому, что из них выросло, уже можно делать точные (с точно рассчитанной вероятностью в смысле) качественные выводы.
no subject
Date: 2010-02-13 03:57 pm (UTC)no subject
Date: 2010-02-13 04:01 pm (UTC)фишка в том, что это не будет совсем другой реальностью. не на марсе же они родятся, эти будущие поколения. и не на клингонском будут говорить.
так что аргумент слабый, сорри )
no subject
Date: 2010-02-13 04:47 pm (UTC)no subject
Date: 2010-02-13 05:56 pm (UTC)no subject
Date: 2010-02-13 06:14 pm (UTC)конечно, уникальность имеет место быть -- но различия в подавляющей массе не больше, чем, скажем, между нетбуком с Вин 7 и сервером с Вин 2000. Вроде, пропасть между ними -- но всё же очень много общего. И сделать байесову сеть, которая будет их (нетбуки от серверов) чётко друг от друга различать по весьма неполным входным данным очень просто. И не из-за того, что они разные -- а из-за того, что они во многом одинаковые.
раён и Бах -- тут чуть посложнее. имеющиеся решения для обнаружения сетевых атак, построенные на байесовых сетях, не дают нам чёткого знания, какой конкретно сетевой пакет уложит систему в deny of service -- зато чётко дают понять, что атака развивается и просто имеет место быть. понимаешь, о чём я?
no subject
Date: 2010-02-13 04:58 pm (UTC)вот когда несколько поколений пройдет через эту "систему", тогда и можно будет о чем-то говорить. в противном случае процент погрешности слишком велик, и всё рискует превратиться как раз в абсурд Азимова с господинами Плейтонами
no subject
Date: 2010-02-13 10:24 pm (UTC)no subject
Date: 2010-02-14 01:31 am (UTC)упрощенно там механика такая. в какой-то момент сеть даёт прогноз событий с определённой вероятностью. дальше события сбываются или не сбываются -- эта информация снова попадает в сеть и она учится.
в нашем случае это могло бы выглядеть так. сеть, накопив какую-то статистику, скажем, по оценкам группы школьников за несколько лет, даёт по группе выпускников прогноз, кто на какую специальность пойдёт учится. оцнека по каждому выглядит, например, так: Вася (Юрист -- 10%, Строитель 5%, Программист 40% итд); Петя (Юрист 30%, Строитель 30%, Программист 1% итд).
потом ей скармливают, кто куда в самом деле пошёл учиться -- и следующий выпуск она уже предскажет точнее. и так -- итерациями.
без итераций сети байеса -- это почти подбрасывание монетки.
no subject
Date: 2010-02-14 12:55 am (UTC)no subject
Date: 2010-02-14 12:57 am (UTC)нормально всё с количеством состояний ))) вопрос постоянного сбора большого массива статистики.
no subject
Date: 2010-02-14 01:03 am (UTC)а чтобы не заморачиваться, вот тебе классический пример: ты менеджер футбольной команды, перед тобой анкеты двух молодых неизвестных игроков, тебе надо выбрать. 1-й: высокий, мощный, бьет с двух ног, блестяще играет головой, отличная скорость. 2-й: маленький, толстенький, бьет только с левой, на втором этаже бесполезен. При прочих равных выбор очевиден. Но второй потом оказался Марадоной.
не измерить людей алгеброй )) весь кайф в неожиданностях
no subject
Date: 2010-02-14 01:06 am (UTC)измерить людей алгеброй, просто результаты будут не точные, а вероятностные.
no subject
Date: 2010-02-14 01:11 am (UTC)я за тех, кто невзирая на сильно неблагоприятные вероятностные прогнозы, говорит "а мне пох, всех убью один останусь" и прет к мечте ))
no subject
Date: 2010-02-14 01:14 am (UTC)раньше мне не приходила в голову мысль наложить на это сеть байеса, пороюсь по .edu, наверняка ченить такое на крысах или лягушках уже постановили )
no subject
Date: 2010-02-14 08:41 am (UTC)в нашем случае это могло бы выглядеть так. сеть, накопив какую-то статистику, скажем, по оценкам группы школьников за несколько лет, даёт по группе выпускников прогноз, кто на какую специальность пойдёт учится. оцнека по каждому выглядит, например, так: Вася (Юрист -- 10%, Строитель 5%, Программист 40% итд); Петя (Юрист 30%, Строитель 30%, Программист 1% итд).
потом ей скармливают, кто куда в самом деле пошёл учиться -- и следующий выпуск она уже предскажет точнее. и так -- итерациями.
ты уже сейчас можешь снимать статистику с 15-летних людей и скармливать её алгоритму. чем дальше с развитием сети, тем всё более полная информация будет о людях в социальных сетях. что они читают, что они слушают, куда ходят и даже что думают.
на уровне обывателя это неэтично, противоречит поправке о тайне личности(которую все нарушают, и люди сами в первую очередь), но ты, похоже, думаешь на государственном уровне, там этика размывается и рождает чудовищ. если их можно будет отслеживать, значит, их возьмут под контроль. как по мне, лучше позаботиться о том, чтобы создать препятствия для этого механизма. не хочется жить в дивном новом мире.
p.s. спасибо за рассказ, я его вспоминала недавно.