(no subject)
Mar. 27th, 2017 08:35 pmпо работе из интереса потыкал палкой pandas
ощущения странные - вроде как тьма возможностей но я постоянно натыкаюсь на какие то не совсем гладкие углы. Но инструмент похоже зачетный
вообще есть некоторая зависть нынешнему поколению - уж очень много хороших бесплатных инструментов появилось
раньше надо было воровать matlab если хотелось чего то такого
теперь от количества всего всего для математики ML и AI глаза разбегаются
вторая возникшая мысль - не попробовать ли вместо сооружения залипухи на пандах и чьей то матери притянуть к этому делу spark - но пока есть ощущение что это некий оверкил
хотя данных не то что бы мало ( ну сотни гиг, кусками по 2-4 гига в батче который надо обрабатывать) но и не много что бы ебаться с кластерами. Плюс растет это хозяйство очень медленно. Пока не решил( тк кажется мне что learning curve у Spark по круче)
ощущения странные - вроде как тьма возможностей но я постоянно натыкаюсь на какие то не совсем гладкие углы. Но инструмент похоже зачетный
вообще есть некоторая зависть нынешнему поколению - уж очень много хороших бесплатных инструментов появилось
раньше надо было воровать matlab если хотелось чего то такого
теперь от количества всего всего для математики ML и AI глаза разбегаются
вторая возникшая мысль - не попробовать ли вместо сооружения залипухи на пандах и чьей то матери притянуть к этому делу spark - но пока есть ощущение что это некий оверкил
хотя данных не то что бы мало ( ну сотни гиг, кусками по 2-4 гига в батче который надо обрабатывать) но и не много что бы ебаться с кластерами. Плюс растет это хозяйство очень медленно. Пока не решил( тк кажется мне что learning curve у Spark по круче)
no subject
Date: 2017-03-27 03:14 pm (UTC)Но спарк такая говнюха внутри, боже мой, боже мой. Каждый раз хочется все переписать.
(no subject)
From:no subject
Date: 2017-03-27 03:29 pm (UTC)Імхо, скейлинг краще тримати під ручним контролем, поки є можливість.
P.S. Можливо курс поганий (він дійсно говнистий і сирий), можливо сам Спарк, можливо і те, і друге. Можливо, розподілені системи по своїй природі важкі.
(no subject)
From:no subject
Date: 2017-03-28 07:13 pm (UTC)(no subject)
From:(no subject)
From:(no subject)
From: