「機械学習のためのデータ処理基盤入門」

2019.10.16

日程：2019/10/24(木)14:30 〜 16:30

募集期間：2019/09/25(水) 15:30 〜2019/10/23(水) 16:00

会場：関東IT健康保険組合大久保健保会館１Ｆ

東京都新宿区百人町2-27-6

主催 : コネクト株式会社、株式会社インザフォレスト

募集内容	Web申し込み無料先着順 14/30人

「機械学習のためのデータ処理基盤入門」

~オープンソースで構築できる並列分散処理環境~

本セミナーは、並列分散処理の主要なOSSである、Spark、hadoop、Cassandraの概要をご紹介する無料セミナーです。
近年、膨大な量のデータが日々生み出されており、さらに今後日本でも５Gなどの導入により入手できるデータ量がさらに増大します。

しかしながら、pythonで処理を行うようなことは、計算時間やリソースなどが大幅にネックとなります。
本セミナーでは、初学者を対象に機械学習のためのデータ処理基盤として、並列分散処理の基礎的な説明から、Spark、hadoop、Cassandraのそれぞれの特徴、処理の動き、導入事例などをご紹介します。

INTHEFOREST（インザフォレスト）社は、上記OSS以外にもKafka、NoSQL、k8sなどを組み合わせて超大規模データ基盤の構築・運用を得意としております。

日　時：10月24日(木) 14:30~16:30 (開場14:15)
費　用：本セミナーは無償です。
対　象：「機械学習」「データ処理基盤」「並列分散処理」などに携わる方やこれから携わる予定の技術者向に
最適な内容でございます。
また、プロポーザルやコンサルティングを担当されておられる方にも有益な内容となっております。

セッション	タイトル
セッション1	イントロダクション・データサイズ：ペタバイトの時代（※1 Peta Byte = 1024 Tera Byte）・並列処理と分散処理・（参考）Pythonライブラリ（Numpy・Pandasなど）を利用することの問題点
セッション２	並列分散処理入門・Apache Sparkとは？・Sparkを用いた分散処理（hadoop+Spark）・分散データベース（Cassandra）・ユーザ事例：サーバ100台規模の商品レコメンデーションエンジン基盤の構築
Q＆A
講演者	株式会社INTHEFOREST　代表取締役社長　冨田和孝日本Cassandraコミュニティーメンバーデータベースエンジニア・システムアーキテクトぐるなび、外国為替、ISPなど、DB中心としたシステム構築・運用・保守を担当。高負荷・大容量・大規模なデータ処理・データ解析基盤作りに強み。また、学生時代は社会言語学を専攻し、「認知意味論」をベースとしたＮＬＰも研究中。