ТЮЖИНА
Подготовка к итоговому тесту по Тюженой
1. Как называется метрика качества, которая оценивает долю правильно найденных положительных объектов среди всех
объектов положительного класса?
-
a) точностью (precision)
-
b) полнота (recall)
-
c) F1-мера
-
d) Точность (score)
2. К библиотекам анализа данных в Python относятся …
(Девочки, тут 3 варианта)
-
a) Tkinter
-
b) Pandas
-
c) NumPy
-
d) Matplotlib
3. Какая из команд выведет столбцы 'gender' и 'math score' датафрейма sp?
-
a. sp.iloc['gender','math score']
-
b. sp.loc(['gender','math score'])
-
c. sp['gender','math score']
-
d. sp[['gender','math score']]
4. Какие строки позволяют отобрать 5 последних строк датафрэйма data?
(Девочки, тут 2 варианта всего)
-
a. data.iloc[-5:-1]
-
b. data.loc[-5:]
-
c. data.iloc[-5:]
-
d. data.head(5)
-
e. data.tail(5)
5. КАРТИНКА НЕ ВОПРОС
ВОПРОС: Как называется вектор, своим направлением указывающий направление возрастания некоторой
скалярной величины φ, (значение которой меняется от одной точки пространства к другой, образуя
скалярное поле), а по величине (модулю) равный скорости роста этой величины в этом направлении?
(Девочки, смотрите, когда такие большие вопросы легче всего акцентировать внимание на каком-то одном знаке, в данном случае у нас будет - φ. Благодаря этому знаку нам будет легче запомнить ответ, чтобы не читать весь вопрос и сразу ответить)
(Либо просто вспоминайте вот такую картинку которая помогает нам ответить на два вопроса в тесте)
-
a. производная
-
b. перцептрон
-
c. гардиент
-
d. среднеквадратичное отклонение
6. Как называется слой, в котором каждый нейрон соединен со всеми нейронами на предыдущем уровне,
причем каждая связь имеет свой весовой коэффициент?
(Подсказка вам, девчульки - Как называется семья в которой есть и мама и папа и дети? (полной) - значит ответ...)
-
a. полносвязный
-
b. Dropout
-
c. сумматорный
-
d. активационный
7. КАРТИНКА НЕ ВОПРОС
ВОПРОС: Какая функция применяется для того, чтобы количественно оценить величину расхождения между
полученными и ожидаемыми решениями нейронной сети?
-
a. функция активации
-
b. функция потерь
-
c. сумматорная функция
-
d. синусоида
8. Какое значение может иметь взвешенная сумма входов нейрона (до использования активационной
функции)?
(СУММА важное слово. Д какое захоти такое и будет)
(Вариант ответа один будет, а не несколько)
-
a. (-1,1)
-
b. [0,1]
-
c. [-1,1]
-
d. (- ∞,+ ∞)
9. Какую метрику целесообразно использовать для оценки качества модели определения опухоли на
рентгеновском снимке?
(Зациклю ваше внимание на "рентгеновском" и будем равнять его по первой букве. Наша русская "р", а английская "r", значит ответ..)
-
a. Accuracy
-
b. F1
-
c. precision
-
d. recall
10. Какую метрику целесообразно использовать для оценки качества модели определения съедобных
ягод по фотографии (из набора съедобных и ядовитых)?
(А тут зациклю ваше внимание на "фотографии" по английски фото будет "Photo", запоминаем только первую букву и ответ будет на эту букву "p")
-
a. precision
-
b. F1
-
c. recall
-
d. Accuracy
11. Какой из предложенных методов используется для предсказания модели?
(Тут девочки ориентируемся на слово "предсказания" наша русская "п" а английская "р")
-
a. predict
-
b. fit
-
c. score
-
d. decision_path
12. Как в деревьях решений называется удаление листов и узлов, потеря которых минимально скажется
на точности модели и увеличении ошибки?
(Удаляем (отсекаем) их нахуй - значит убиваем, а НЕ ОГРАНИЧИВАЕМ)
-
a. ранняя остановка
-
b. ограничение глубины дерева
-
c. отсечение ветвей
-
d. обучение модели
13. Как называется негативное явление, возникающее, когда алгоритм обучения вырабатывает
предсказания, которые слишком близко или точно соответствуют конкретному набору данных и не
подходят для применения алгоритма к дополнительным данным или будущим наблюдениям?
(Опять ебучий длинный текст, видим это - "негативное явление", отвечаем это "переобучение")
-
a. переобучение
-
b. кроссвалидация
-
c. недообучение
-
d. решающее правило
14. Какой атрибут отвечает за минимальное число образцов в листе?
(Минимальное число образцов в листе - сократим как MSL)
-
a. min_impurity_decrease
-
b. max_depth
-
c. min_samples_split
-
d. min_samples_leaf
15. Какой атрибут отвечает за минимальное число образцов в узле для разделения?
(Минимальное число образцов в узле для разделения - сократим как MSS)
-
a. max_depth
-
b. min_samples_leaf
-
c. min_samples_split
-
d. min_impurity_decrease
16. Какой из предложенных ниже методов отвечает за обучение модели?
-
a. fit
-
b. get_depth
-
c. predict
-
d. score
17. Какой классификатор необходимо использовать для предсказания размера одобренного кредита по
заданным параметрам?
(Везде где нужно найти ответ в цифрах это РЕГРЕССИЯ)
(Тут один вариант ответа)
-
a. Query
-
b. DecisionTreeRegressor
-
c. Может быть использован DecisionTreeClassifier и DecisionTreeRegressor
-
d. DecisionTreeClassifier
18. Какие из перечисленных задач относят к задачам обучения с учителем?
(Не знаю как объяснить поэтому дам вам только ответы (оба варианта) чтобы просто запомнить)
-
а. задача классификации
-
b. задача регрессии
19. Какие из перечисленных задач относят к задачам обучения без учителя?
(Тоже самое, только ответы)
-
а. задача кластеризации
-
b. восстановление пропущенных значений
20. Отметьте верные утверждения...
(В таких вопросах пытаемся выделить главное из ответов, в данном случае можно запомнить, что ответЫ будут те, где только функции начинаются на букву "С" - это сигма бой и суетолог)
-
a. В качестве функции активации нейрона может выступать сигмоидная функция
-
b. Результат функции активации всегда число от 0 до 1.
-
с. Функция активации получает на вход результат выполнения сумматорной функции
-
d. В качестве функции активации может выступать только функция ReLU
21. Отметьте верные утверждения...
(Тут запоминаем, что один из ответОВ будет с маленькой буквы (анал дендритов), а второй начинается на букву "К")
-
a. В искусственном нейроне не менее 5 входов
-
b. аналогом входов искусственного нейрона в естественном нейроне являются дендриты
-
с. В искусственном нейроне неограниченное количество выходов
-
d. Количество входов и весов в нейроне должно совпадать
22. Отметьте верные утверждения, о нейронной сети, которую видите на экране...
-
a. сеть – графическое отображение Перцептрона
-
b. в сети 4 входа
-
c. сеть многослойная
-
d. все слои сети полносвязные
23. Отметьте верные утверждения...
(Тут ответ только один и запомним его благодаря тому, что нам пофиг сколько слоёв, поэтому мы ебашим НЕОГРАНИЧЕННОЕ число)
-
a. В выходном слое нейронной сети неограниченное число нейронов
-
b. В выходном слое нейронной сети не может быть больше 10 нейронов
-
c. В выходном слое нейронной сети всегда находится только один нейрон
-
d. Выходной слой нейронной сети не содержит нейронов
24. Отметьте верные утверждения о метрике качества accuracy…
(Тут девчули запоминаем, что "accuracy" - это КЛАССИФИКАЦИЯ, НО НЕ РЕГРЕССИЯ и что отношения любят наблюдения)
-
a. accuracy показывает долю объектов, названных классификатором положительными и при этом действительно являющихся положительными
-
b. accuracy показывает отношение верно классифицированных наблюдений к общему количеству наблюдений
-
c. accuracy особенно полезна в задачах с несбалансированными классами - когда одних значений (ядовитых грибов, например) значимо меньше, чем других (съедобных грибов).
-
d. accuracy используется преимущественно в задачах классификации, но не регрессии
25. Отметьте верные утверждения о количестве признаков, которые рассматривает каждое отдельное
дерево в модели «Случайный лес»?
(«Случайный лес» - он работает с цифрами а не словами, а кто у нас работает с цифрами? Регрессия! Поэтому ответ там где слово "регрессия" и помните как долго грузит он данные, значит ответ "с")
-
a. в задачах классификации это значение по умолчанию равно половине всех имеющихся признаков
-
b. это значение всегда должно быть больше глубины леса
-
c. чем больше это значение, тем дольше настраивается модель
-
d. чем больше это значение, тем разнообразнее деревья
-
e. в задачах регрессии это значение по умолчанию равно трети всех имеющихся признаков
26. Отметьте верные утверждения о случайном лесе...
(Тут только ответы. Их было 5 вопросов, но я оставила только ответы)
-
a. время настройки и работы случайного леса увеличивается пропорционально количеству деверев в лесу.
-
d. случайный лес применим для решения задач регрессии
-
e. чем больше деревьев в лесу, тем лучше качество предсказания
27. Отметьте верные утверждения о схеме построения отдельного дерева в модели «Случайный лес»?
(Тут ответ один, ориентируемся из вопроса на "построения отдельного дерева" - ответ там где есть слово "подвыборка")
-
a. для обучения используется вся обучающая выборка
-
b. для обучения используется вся обучающая выборка
-
c. для обучения используется подвыборка обучающей выборки
-
d. для обучения всегда используется половина обучающей выборки
28. Отметьте верные утверждения об алгоритме случайного леса - Random Forest.
(Помним, что "случайный лес" - это про числа и регрессию. Значит ищем ответ где есть слово "регрессия" и второй ответ будет начинаться с заглавной буквы "К")
-
a. Число деревьев в лесу всегда равно удвоенному количеству предсказываемых классов
-
b. Итоговым предсказанием модели является предсказание случайного дерева
-
c. Параметры для каждого дерева (глубина, минимальное число образцов в листе и т.д.) выбираются случайно
-
d. Предсказание модели в задачах регрессии - усреднённые предсказания деревьев
-
e. Каждое дерево в лесу получает случайный поднабор данных
29. Отметьте верные утверждения о влиянии параметров решающего деревья на переобучение...
(Первый ответ запомним как max_leaf_nodes = mln, а второй ответ запомним как два МАЛЕНЬКИХ гнома глубина дерева и тенденция)
-
a. Чем меньше значение min_samples_split, тем меньше тенденция к переобучению
-
b. Чем меньше значение min_samples_leaf, тем меньше тенденция к переобучению
-
c. Чем меньше значение параметра max_leaf_nodes, тем меньше тенденция к переобучению
-
d. Глубина дерева никак не влияет на его переобученность
-
e. Чем меньше глубина дерева, тем меньше тенденция к переобучению
30. Отметьте верные утверждения о деревьях решений...
(Как тут запомнить ответы? Запоминаем как ЧСs. предложение которое начинается на "Ч", оно тут одно и второй ответ начинается с буквы "С"со словом "sample")
-
a. свойство samples указывает на количество примеров в узле
-
b. свойство gini определяется только для листьев, но не для узлов
-
c. чем меньше свойство gini, тем однороднее примеры в листе
-
d. параметр gini, во всех листьях должен иметь одинаковые значения
31. Для чего используется подвыборочный слой (иначе слой пулинга, подвыборки, субдискретизации)?
(Запоминаем что наши ДВА ответа будут начинаться только на букву "У")
-
a. распознавание мелких деталей изображения
-
b. разделение изображения на фрагменты
-
c. ускорение вычислений
-
d. уменьшение изображения
32. Что такое Перцептрон?
(Что же такое парцетамол и как запомнить ответ либо запомнить что ответ начинается на букву "О" лиобо что он цаца МОДЕЛЬ)
-
a. одна из первых моделей искусственного нейрона
-
b. линейная функция активации
-
c. название слоя субдескретизации в библиотеке keras
-
d. фамилия автора концепции сверхточных нейронных сетей, и общее название таких сетей
33. В каких задачах для оценки качества модели используется средняя абсолютная ошибка (mae)?
(Оставлю тут только ответ, мне лень другие вопросы вставлять)
34. В каких задачах для оценки качества модели может быть использована средняя квадратичная
ошибка (mse)?
(Кошки, собаки и ириски идут нахуй, правильнЫЕ ответЫ где есть намёк на бабки)
-
a. как в задачах определения вида ириса по размеру лепестка и чашелистника
-
b. в задаче классификации кошек и собак по фотографии
-
c. в задаче предсказания стоимости драгоценного камня, по его чистоте и весу
-
d. в задаче предсказания размера одобренного кредита по заработной плате, кредитной истории и т.д.
35. Есть набор изображений зеленого горошка, вам необходимо выделить все изображения заболевших
растений (важно, чтобы все больные растения были в выборке, попадание туда небольшого
количества здоровых растений – не критично). Какую метрику качества модели целесообразнее
использовать?
(Опять огромный текст, выделяем "зеленый горошек" и запоминаем что ответ будет recall)
-
a. precision
-
b. F1
-
c. Accuracy
-
d. recall
36. Модель машинного обучения классифицирует кошек и собак по фото. Модели предъявляется
фотография кошки, и модель классифицирует её как фотографию кошки. Как называется такой
исход?
(Вставлю только ответ)
-
a. Либо TP, либо TN, в зависимости от того, какой класс был признан целевым (положительным)
37. За что отвечает параметр n_estimator?
(Вставлю только ответ)
-
b. количество деревьев в модели «Случайный лес»
38. За что отвечает параметр max_features?
(Как запомнить ответ с макс фактором - он сааамый длинный из 4-х)
-
a. количество деревьев в модели «Случайный лес»
-
b. максимальная глубина дерева в модели «Случайный лес»
-
c. количество признаков, которые рассматривает каждое отдельное дерево в модели «Случайный лес»
-
d. количество примеров в листе
39. Дерево решений —
(Ответ (один) запомнить можно благодаря тому что предложение начинается с буквы "С" и в конце предложения «если - то»)
-
a. свойство интеллектуальных систем выполнять отдельные функции интеллекта человека, в том числе творческие;
-
b. метод решения задач, точный алгоритм решения которых заранее известен
-
c. средство поддержки принятия решений, использующееся в машинном обучении, анализе данных и статистике, представляет собой иерархическую структуру правил вида «если - то»
-
d. разнообразные данные, которые поступают с постоянно растущей скоростью и объем которых постоянно растет;
40. Сколько листьев в указанном ниже дереве?
41. Сколько узлов в указанном ниже дереве?