cbeta: (Default)
[personal profile] cbeta
Залезла в кои веки в фейсбучек, от нечего делать прошла тест, в котором составители обещали угадать про меня все за 20 вопросов.

Well, it seems that you are: 1. Male 2. A teenager (although not for too much longer) 3. Still a school, but spending plenty of time thinking about what to do after 4. Somehow have the capacity to eat what you want, when you want, with absolutely no consequences 5. You know that things might be a little easier if you accepted other people's advice a little more often.

Короче, я - мой племянник Алеша.

Date: 2014-12-14 12:30 pm (UTC)
From: [identity profile] vmoldavsky.livejournal.com
Хе-хе, а я сразу загадал так, что он не отгадал за 80 вопросов (правда, они повторялись) и три попытки ответить. :) Притом что книга великая, персонаж главный и даже заглавный. (Ульрих из "Человека без свойств".) Он меня потом спросил, кто это, но я ему не сказал, пусть кто-нибудь другой порадуется. :)

Ну поскольку количество вариантов фидбека не больше количества вариантов ответа на вопросы, если 20 вопросов на да и нет, это всего 4096 вариантов, а на самом деле гораздо меньше, конечно. Подшаманивать вроде ясно как. На каждый элемент в базе у тебя есть полное описание его свойств, причем часть свойств "спрашиваемые", а часть составляют результат фидбека. Надо выбирать то свойство из спрашиваемых, по которому еще не отброшенные элементы делятся на "да" и "нет" ближе всего к пропорции один к одному. Конечно, сформулировать хорошие вопросы -- это искусство, но эмпирически установить, насколько они хорошие (т.е. дифференцируют), легко.

Date: 2014-12-14 12:51 pm (UTC)
From: [identity profile] http://users.livejournal.com/_cbeta_/
4096 вариантов фидбека могут и не потребоваться - это ж, как правило, дискретные ответы по небольшому количеству осей (м-ж, возраст, какие-то типичные склонности), причем наверняка сильно коррелированные, т.е. размерность пространства ответов можно с помощью PCA над выборкой респондентов еще и понизить.

Т.е. как выбрать самые дискриминирующие по (постоянно растущей) базе респондентов 20 вопросов из большой готовой базы вопросов примерно понятно как (случайно набирая их в тест с некоторой весовой функцией, к примеру). А вот как комбинировать? Как из ответов на "Любимое блюдо" или "способ завязывания шнурков" сгенерировать новый, более дискриминационный вопрос?

Date: 2014-12-14 01:05 pm (UTC)
From: [identity profile] vmoldavsky.livejournal.com

Ну это зависит от того, сколько ты предсказывать хочешь. Ясно, что мужчина/женщина, примерный возраст -- это немного вариантов. А 3, 4 и 5 в случае твоего фидбека выше просто вытекают из 1 и 2. :) Но для людей постарше, кстати, таких общих черт уже сильно меньше, там еще три свойства нужно, наверно, честно придумывать.

Да, я уже понял, что не понял. :) Видимо, просто нужно пробовать очень много вопросов. И обязательно использовать наработки британских ученых. :)

Profile

cbeta: (Default)
cbeta

January 2026

S M T W T F S
     123
45678910
11121314151617
18192021222324
25262728293031

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 11th, 2026 09:29 am
Powered by Dreamwidth Studios