Октябрь 2025 – csnotes.ru

Оценка асимметрии и эксцесса данных

8 месяцев ago

При проведении исследования данных полезно проверить распределения признаков. Для числовых признаков принято проверять распределение на асимметрию –...

Data Science • ML

df.describe() – описательные статистики – важные нюансы

8 месяцев ago

На основании вывода команды train_data.describe().T (транспонированного описания числовых столбцов) можно сделать ключевые выводы о распределении, масштабе и...

AI

Исследование «Би-би-си»: чат-боты почти в половине случаев искажают новости

8 месяцев ago

Источник: ИИ-помощники, которые становятся привычным инструментом для миллионов людей, регулярно искажают новостной контент — независимо от языка...

Data Science • ML

EDA – исследовательский анализ данных, основные принципы

8 месяцев ago

Исследование – первое, что необходимо выполнить с данными. Погружение в тему Необходимо понять, с чем имею дело. Погрузиться в содержимое данных, понять...

Computer science • Термины

Hash integrity

8 месяцев ago

Hash integrity (целостность хеша) относится к проверке целостности данных с помощью хеш-функций. Это процесс, который позволяет убедиться, что данные не были...

Data Science • ML

Табличные данные. План исследования и подготовки к моделированию.

8 месяцев ago

При первичном знакомстве с табличными данными важно выполнить ряд шагов, чтобы исключить распространенных ошибок. Разбиение на train/test/val выборки...

Data Science • ML

Кроссвалидация. Выбор оптимальной стратегии.

8 месяцев ago

Оптимальная стратегия кросс-валидации (Cross-Validation, CV) — это не просто выбор одного метода (вроде K-Fold), а комплексный план, который учитывает...

Data Science • ML

Несогласованность в данных (data inconsistency)

8 месяцев ago

Несогласованность в данных (data inconsistency) — это одна из самых частых и коварных проблем, которые встречаются при исследовательском анализе данных (EDA)...

Data Science • ML

Утечка данных. Как обнаружить и предотвратить.

8 месяцев ago

Обнаружение и предотвращение утечки данных (Data Leakage) — это одна из самых важных и сложных задач в машинном обучении. Утечка данных приводит к завышенной...

Computer science • Термины

Тонкий и толстый клиенты

8 месяцев ago

Термины «толстый клиент» (Thick/Fat Client) и «тонкий клиент» (Thin Client) описывают два основных подхода к организации клиент-серверной архитектуры в...

Computer science • Программирование • Термины

Обфускация кода

8 месяцев ago

Один из способов защиты кода. Обфускация — это процесс запутывания кода. Вместо того чтобы делать его нечитаемым, обфускаторы изменяют названия переменных...

Computer science • Программирование • Термины

Динамическое программирование

8 месяцев ago

Динамическое программирование – это подход к решению задач, при котором задача разбивается на рядперекрывающихся подзадач. Решение каждой подзадачи...

Октябрь 2025
Пн	Вт	Ср	Чт	Пт	Сб	Вс
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Archive - Октябрь 2025