cbeta | (no subject)

You're viewing

cbeta's journal
Create a Dreamwidth Account Learn More

Reload page in style: site light

Залезла в кои веки в фейсбучек, от нечего делать прошла тест, в котором составители обещали угадать про меня все за 20 вопросов.

Well, it seems that you are: 1. Male 2. A teenager (although not for too much longer) 3. Still a school, but spending plenty of time thinking about what to do after 4. Somehow have the capacity to eat what you want, when you want, with absolutely no consequences 5. You know that things might be a little easier if you accepted other people's advice a little more often.

Короче, я - мой племянник Алеша.

Flat | Top-Level Comments Only

From:

vmoldavsky.livejournal.com

Хе-хе, а я сразу загадал так, что он не отгадал за 80 вопросов (правда, они повторялись) и три попытки ответить. :) Притом что книга великая, персонаж главный и даже заглавный. (Ульрих из "Человека без свойств".) Он меня потом спросил, кто это, но я ему не сказал, пусть кто-нибудь другой порадуется. :)

Ну поскольку количество вариантов фидбека не больше количества вариантов ответа на вопросы, если 20 вопросов на да и нет, это всего 4096 вариантов, а на самом деле гораздо меньше, конечно. Подшаманивать вроде ясно как. На каждый элемент в базе у тебя есть полное описание его свойств, причем часть свойств "спрашиваемые", а часть составляют результат фидбека. Надо выбирать то свойство из спрашиваемых, по которому еще не отброшенные элементы делятся на "да" и "нет" ближе всего к пропорции один к одному. Конечно, сформулировать хорошие вопросы -- это искусство, но эмпирически установить, насколько они хорошие (т.е. дифференцируют), легко.

From:

http://users.livejournal.com/_cbeta_/

4096 вариантов фидбека могут и не потребоваться - это ж, как правило, дискретные ответы по небольшому количеству осей (м-ж, возраст, какие-то типичные склонности), причем наверняка сильно коррелированные, т.е. размерность пространства ответов можно с помощью PCA над выборкой респондентов еще и понизить.

Т.е. как выбрать самые дискриминирующие по (постоянно растущей) базе респондентов 20 вопросов из большой готовой базы вопросов примерно понятно как (случайно набирая их в тест с некоторой весовой функцией, к примеру). А вот как комбинировать? Как из ответов на "Любимое блюдо" или "способ завязывания шнурков" сгенерировать новый, более дискриминационный вопрос?

From:

vmoldavsky.livejournal.com

Ну это зависит от того, сколько ты предсказывать хочешь. Ясно, что мужчина/женщина, примерный возраст -- это немного вариантов. А 3, 4 и 5 в случае твоего фидбека выше просто вытекают из 1 и 2. :) Но для людей постарше, кстати, таких общих черт уже сильно меньше, там еще три свойства нужно, наверно, честно придумывать.

Да, я уже понял, что не понял. :) Видимо, просто нужно пробовать очень много вопросов. И обязательно использовать наработки британских ученых. :)