Python для анализа данных - Популярные вопросы | Страница 1

Python для анализа данных

Вопросов: 222

Ответов: 1239

Популярные вопросы

balabaevkd
3/16/2021, 11:20:38 AM
Ответов: 20
Привет. У меня стоит задача подсчитать интервал возвращения клиента в магазин. Среднее

у меня 17, медиана 12. Если брать от среднего доверительный интервал, получается 17 + 1,96*se = 19. Правильно ли будет интерпретировать, что вероятность возврата клиента после 19 дня менее 5%?

Funny2day
7/11/2021, 10:45:59 AM
Ответов: 19
Всем привет Хочется на питоне написать что-то типа модельки для прогнозирования личных

расходов/доходов Уже сделал первый подход - генерирую график сколько денег через год будет в зависимости от всяких повторящихся доходов, расходов. Но для этого вручную генерирую сценарии. Что-то типа "базовый" и другие Но хочется, чтобы сценарии сами генерились. Например указывал бы диапазон возможных трат/доходов и строилось бы 50 вариантов движения денег в течение года Может кто-то подобным занимался? : В какую сторону копать?

eugene_o
10/12/2020, 6:47:07 AM
Ответов: 16
Кто-то может подсказать?
Weijeet
2/26/2021, 2:56:15 PM
Ответов: 15
Всем привет! Так как я планирую начинать изучать все, что связано с

Data Science и больше идти в сторону ML Engineer, мне бы хотелось узнать некоторые вещи: 1 Основываясь на своем опытеи опыте ваших коллег/друзей можете сказать, сколько времени в среднем проходит от начала изучения до первой стажировки/работы? Понимаю, что от многих факторов зависит, но среднее время в день изучения темы - 5 часов. 2 По вашему мнениюили точным знаниям, как сильно урезается количество возможных мест работы при отсутствии диплома о высшем образовании? Действительно ли ты скорее не пробьёшься без образования, нежели с ним? Мой бекграунд - веб-программирование. У меня распутье между вебом и датой, в первом пробовал себя около 2-3 месяцев, уровень ~Junior, второй рассматриваю для себя как один из вариантов. Не лишним наверное будет указать, что мне 18 лет и наверное время есть. Заранее большое спасибо!

shkaf_leha
5/20/2021, 1:36:52 PM
Ответов: 14
Народ, Я тут на datascience учился. Мне предлагают хорошую работу аналитиком,

но надо powerbi. Есть тут спецы? Могли бы посоветовать, где максимально быстро можно в нем разобраться. Курс или что-то. И чётко примерно надо времени для начального понимания

IvanD_E
3/15/2021, 7:59:53 PM
Ответов: 14
Нет ли аналога PowerQury чтобы были и готовые библиотеки?
PavloZ
12/22/2020, 7:02:38 AM
Ответов: 14
Бабушки с экселем могут все. Таков путь бюджетника. А причем тут мы?
Аноним
6/2/2021, 12:08:48 PM
Ответов: 14
Коллеги, подскажите, WTF? Есть два датасета. В первом есть дата операции, UID

юзер айди, и вторичные данные с 2018 года. Во втором есть UID и дата регистрации, отфильрованная с 2020 года. Делаю inner merge, чтобы отфильровать клиентов по дате регистрации, но получаю датафрейм, где дата регистрации 2020 +, но операции по 2018+. Это дата инжинер накосячил или я туплю?

ValiaBlack
3/1/2021, 7:06:42 AM
Ответов: 12
Всем привет. Такой вопрос, а какие есть способы заполнения пустых, категориальных значений,

кроме средниквадратичного и случайного заполнения?

kopyl
6/28/2021, 4:41:26 PM
Ответов: 12
Уважаемые, где работаете с большими датасетами, скажем, гигов под 300? Качаете все

себе на комп или же где-то в облаке? Если в облаке, то где и как? Стучитесь к ним удалённо или работаете на удалённом сервере?

RBulgakov
8/3/2021, 8:16:05 AM
Ответов: 12
Всем привет! Не кто не сталкивался с такой задачей?! нужно получить

один знак после запятой, при этом если число скажем в переменной имеет -0.0868979435532 на выходе получаю -0.0%, а в данном случае должны округлить до -0.1% подскажите каким способом лучше сделать

PavloZ
4/25/2021, 1:39:14 PM
Ответов: 11
ну а почему выходной не считается "сигналом" как таковым? на вход своей

нейросети подайте индикатор выходного

Аноним
5/8/2021, 7:43:04 AM
Ответов: 11
Кто-нибудь знает как спарсить номер телефона, если он в закрытом блоке? SELENIUM

не предлагать

roveo
8/25/2021, 5:59:46 PM
Ответов: 11
Скажите, а кто какие значет варианты как доставить графики до конечных пользователей?

Вот скажем я написал SQL, вытащил DataFrame, построил график в bokeh/matplotlib/ещё в чём-то. Как дальше его расшарить в рамках бизнеса?

satrum
3/3/2021, 8:42:21 AM
Ответов: 11
Вы че тут второй день решаете чужую проблему а человеку было лень

почитать доки ?

Аноним
8/11/2021, 5:31:16 PM
Ответов: 11
Добрый вечер. Подскажите пожалуйста кто знает. Когда собираете данные с сайта в

эксель файл. Мне перед этим надо зайти в личный кабинет на сайте. После входа когда пытаюсь скачать показывает что вход в кабинет не произведён. Как быть?

yelrik
4/21/2021, 4:39:17 PM
Ответов: 11
нормально, что pandas excel файл на 300к строк и 20 столбцов читает

уже 5 минут?

abdulgalimov
3/3/2021, 6:00:00 PM
Ответов: 11
Господа аналитики, подскажите как правильно считать retention? Допустим юзер пришел в 0,

1 и 2 день. После этого 3 день пропустил, и пришел на 4й. Этого юзера засчитываем только за первые 3 дня? или все 5? или все кроме 3го?

Аноним
2/26/2021, 4:53:51 PM
Ответов: 10
Помогите с визуализацией, подайте идею или скиньте статью. Например, есть описание футбольных

команд, есть числовые признаки и порядковые и категориальные. Допустим я решаю задачу регрессии: предсказываю сколько команда забьёт голов за сезон. Пусть для одной команды предсказание получилось 100, для второй 200. Как грамотно визуализировать разницу команд по фичам? Для числовых признаков понятно -диаграмма со столбиками разной высоты. А как быть с категориальных и фичами?

Zurab100
12/15/2020, 10:49:25 AM
Ответов: 10
Доброго времени суток! Разбираю кроссвалидацию в fb Prophet для прогнозирования. по

этой ссылке https://facebook.github.io/prophet/docs/diagnostics.html#parallelizing-cross-validation Не могу понять что значат термины. Horizon - период, на котором я хочу проверить точность прогноза, Initial - период, на котором модель будет обучаться Period - уже не очень понимаю что. Что значит интервал между датами отсечения. и что такое отсечки? Статью раз 20 перечитал и на калькуляторе пересчитывал периоды, но не очень понял.

Аноним
2/23/2021, 12:41:00 PM
Ответов: 10
Всем привет! Ребята, объясните, пожалуйста, зачем чтобы переименовать столбцы в датафрейме пишут

такое: df.set_axis['name1','name2'], axis='columns', inplace=True По сути я могу сделать тоже самое, через: df.columns = ['name1','name2'] Результат тот же, а писать меньше. Может я что-то не понимаю?

Аноним
12/22/2020, 6:59:22 AM
Ответов: 10
Всем привет! Занимаюсь планированием распределения детей в пункты проведения экзаменов, с Питоном

знаком слабо, поэтому подскажите, в какую сторону копать. Дано - 9 пунктов, с разной вместимостью, у каждого - свой код и своя вместимость. При распределении детей участники из конкретной школы, если она является пунктом проведения экзаменов, идут сдавать у себя, у них приоритет, вместимость пункта уменьшается на эту величину. Оставшихся участников надо равномерно распределить по пунктам. Плюс у программы должна быть возможность перераспределения участников вручную. Количество участников из всех школ разное, разумеется, т.е. тут надо перебирать значения. Может есть какое-то готовое решение?

Аноним
4/6/2021, 6:03:52 AM
Ответов: 10
можете посоветовать с чего начать C++ изучать?
Аноним
4/29/2021, 6:23:40 PM
Ответов: 10
Ребята, привет. А можно генерировать переменные через цикл? Не смог нагуглить… Грубый

пример: test=‘’ for x in range2: f’{test}{x}’ = ‘’ Ожидаю 2 переменные test1 test2 На тестах не получается…

Mark_Parshkov
8/25/2021, 4:00:51 PM
Ответов: 36
Привет Подскажите, плиз, функцией read_csv из библиотеки polars можно как то прочитать

файл с кириллицей? в encoding нет cp1251...