Логотип YeaHub

База вопросов

Собеседования

Тренажёр

База ресурсов

Обучение

Навыки

Задачи

Войти

Выбери, каким будет IT завтра — вместе c нами!

YeaHub — это полностью открытый проект, призванный объединить и улучшить IT-сферу. Наш исходный код доступен для просмотра на GitHub. Дизайн проекта также открыт для ознакомления в Figma.

© 2026 YeaHub

AI info

Карта сайта

Документы

Медиа

Вопросы Data Scientist


Как получить первые несколько строк DataFrame?

  • Рейтинг:

    1

  • Сложность:

    3

Для получения первых строк DataFrame используется метод head(n), где n – количество строк (по умолчанию 5). Также можно использовать iloc[:n], который работает аналогично срезам списков в Python.

Подробнее

Как считать данные в DataFrame из CSV-файла?

  • Рейтинг:

    1

  • Сложность:

    4

Для загрузки данных из CSV-файла в Pandas используется метод read_csv(). Он принимает путь к файлу и дополнительные параметры, такие как разделитель или кодировка. Также можно использовать метод read_table(), указав delimiter для CSV-файлов с нестандартными разделителями.

Подробнее

Какие существуют способы создания DataFrame в Pandas?

  • Рейтинг:

    2

  • Сложность:

    5

В Pandas DataFrame можно создать несколькими способами:

- Пустой DataFrame – pd.DataFrame().

- Из списка – pd.DataFrame(list).

- Из списка списков – pd.DataFrame(list_of_lists).

- Из словаря списков – pd.DataFrame(dict_of_lists).

- Из списка словарей – pd.DataFrame(list_of_dicts).

- Из Series – pd.DataFrame(pd.Series()).

- Из CSV или Excel – pd.read_csv(), pd.read_excel().

Подробнее

Что такое DataFrame в Pandas?

  • Рейтинг:

    2

  • Сложность:

    4

DataFrame – это основная структура данных в Pandas, которая представляет собой таблицу с именованными колонками и индексированными строками. Он позволяет загружать, изменять и анализировать данные, а также выполнять операции фильтрации, группировки и агрегации.

Создать DataFrame можно с помощью pd.DataFrame(data), где data может быть списком, словарем, массивом NumPy, CSV-файлом и т. д.

Подробнее

Как создать копию Series в Pandas?

  • Рейтинг:

    2

  • Сложность:

    3

В Pandas можно создать копию Series двумя способами:

- Поверхностное копирование (shallow copy) – копирует только ссылки на данные, поэтому изменения в копии отразятся на оригинале. Используется ser.copy(deep=False).

- Глубокое копирование (deep copy) – создает полную независимую копию, изменения не влияют на оригинал. Используется ser.copy(deep=True).

По умолчанию copy() создает глубокую копию (deep=True).

Подробнее

Какие существуют способы создания Series в Pandas?

  • Рейтинг:

    2

  • Сложность:

    2

В Pandas Series можно создать разными способами:

- Пустая серия (pd.Series()) создаёт пустой объект.

- Из массива NumPy (pd.Series(np.array([...]))) позволяет использовать массив NumPy.

- С собственным индексом (pd.Series([...], index=[...])) задаёт кастомные индексы.

- Из списка (pd.Series([...])) использует обычный список Python.

- Из словаря (pd.Series({ключ: значение})) создаёт серию с индексами-ключами.

- Из скалярного значения (pd.Series(значение, index=[...])) создаёт серию с повторяющимся значением.

- С помощью функций NumPy (pd.Series(np.linspace(...))) генерирует данные с NumPy.

- Через range() или list comprehension (pd.Series(range(...))) создаёт последовательность.

Подробнее

Что такое Series в Pandas?

  • Рейтинг:

    2

  • Сложность:

    5

Series – это одномерный массив с метками (индексами), хранящий данные одного типа. Он похож на список, но поддерживает индексацию и быстрые операции. Создать Series можно из списка, словаря или массива NumPy.

Подробнее

Какие ключевые возможности есть в Pandas?

  • Рейтинг:

    2

  • Сложность:

    6

Pandas предоставляет мощные инструменты для обработки данных:

- Чтение и запись данных в CSV, Excel, SQL и другие форматы.

- Удаление пропущенных значений и фильтрация данных.

- Объединение, слияние и группировка данных.

- Манипуляции со столбцами и строками.

- Высокая производительность благодаря NumPy.

Подробнее

Какие структуры данных поддерживает Pandas?

  • Рейтинг:

    3

  • Сложность:

    3

В Pandas есть две основные структуры данных:

- Series – одномерный массив с индексами, похожий на список.

- DataFrame – двумерная таблица с метками строк и столбцов, аналогичная SQL-таблице или таблице в Excel.

Подробнее

Что такое Pandas?

  • Рейтинг:

    3

  • Сложность:

    4

Pandas — это библиотека для обработки и анализа данных в Python. Она построена на основе NumPy и предоставляет удобные структуры данных, такие как Series (одномерные массивы) и DataFrame (таблицы). С ее помощью можно загружать, обрабатывать, фильтровать и анализировать большие наборы данных. Pandas поддерживает работу с пропущенными значениями, слияние таблиц и группировку данных. Эта библиотека широко используется в науке о данных и машинном обучении.

Подробнее

Специализация

React Frontend Developer

Python Developer

Java Backend Developer

Node.js Backend Developer

Golang Backend Developer

Посмотреть все

Выберите навыки

Git

Git

MongoDB

Postgres

Postgres

Python

Docker

Docker

Посмотреть все

Сложность

1-3

4-6

7-8

9-10

Рейтинг вопросов

1

2

3

4

5

Подпишись на Data Science в телеграм