【IT】Salesforce、機械学習自動化ライブラリをオープンソースで公開

今月の関連人気記事
(集計単位:1ヶ月)
1: 田杉山脈 ★ 2018/08/23(木) 21:00:34.31 ID:CAP_USER

米Salesforce.comは、機械学習自動化ライブラリ「TransmogrifAI」をオープンソースで公開した。TransmogrifAIの技術は、同社のAIプラットフォーム「Einstein」でも使われている。

TransmogrifAIは、Scalaで開発された機械学習自動化ライブラリで、Apache Spark上で動く。顧客の行動の予測などで機械学習モデルを使う際に、数行のコードで自動化を実現できる。

TransmogrifAIのWebサイトでは次のように説明されている。「このライブラリの開発で主眼を置いたのは、機械学習の自動化を通じて機械学習開発者の生産性を高めること、そして、コンパイル時の型安全性やモジュラー性、再利用性を支えるAPIだ。自動化によって、手動チューニングのモデルに近い精度を実現しながらも、時間を100分の1程度に短縮できる」

SalesforceのEinsteinチームでデータサイエンス担当シニアディレクターを務めるShubha Nabar氏は、TransmogrifAIについて解説する長文の記事を、8月16日付けでMediumに投稿した。同氏は「今から3年前、Salesforceのプラットフォームで機械学習機能の構築に着手した時に、エンタープライズ規模の機械学習システムの構築はとりわけ大変だと我々は学んだ」と述べている。

Salesforceにとって、Einsteinの開発にあたって重要だったのは、インテリジェントな洞察や推奨される行動を提示できるようにしつつも、あらゆる顧客企業のデータをひとまとめにしないことだった。この部分が大きな挑戦となったSalesforceは、米MetaMindをはじめ、機械学習を専門とする企業をいくつか買収した。MetaMindの創業者であるRichard Socher氏は現在、Salesforceのチーフサイエンティストを務めている。

SalesforceのMarc Benioff最高経営責任者(CEO)は、2016年の「Dreamforce」で次のように話していた。「これまでは、確認や正規化が可能なデータでなければ、インテリジェンスを適用できなかった。当社にはペタバイト級の膨大なデータがあり、必要なデータはそろっている。現在では、顧客企業との信頼関係を損なうことなく、そのデータをオペレーションの基盤にできるようになった」

Nabar氏の今回の記事も、こうした点について言及している。「我々は、いかなるユースケースに関しても、顧客企業ごとに固有の機械学習モデルを構築する必要がある。グローバルなモデルを構築できたとしても、実際に構築する意味はまったくない。データは顧客企業ごとに固有だからだ。スキーマが異なり、形状が異なり、ビジネスプロセスの違いに伴うバイアスが異なる」

「顧客企業にとって真に役立つ機械学習を実現するためには、それぞれの顧客企業のデータを使って、一つひとつのユースケースに合わせてトレーニングした、固有の機械学習モデルを膨大に構築し展開する必要がある」

さらに同氏は続ける。「大勢のデータサイエンティストを採用することなしに、これを実現するとしたら、自動化しかない。現在の機械学習自動化ソリューションの多くは、機械学習のワークフロー全体の中で、ごく一部分のみに焦点を当てているか、あるいは、画像、音声、言語に関して、同種の非構造化データ向けに構築されているかのどちらかだ」

「だが、我々に必要なのは、異種の構造化データを効率的に処理するモデルを、スピーディーかつ大規模に生成できるソリューションだった」
https://tech.nikkeibp.co.jp/it/atcl/idg/14/481709/082200459/

2: 名刺は切らしておりまして 2018/08/23(木) 21:02:53.89 ID:f2rEpS8S
ベニオフはYOSHIKIの友達なんだよね
一緒に京都旅行してた

3: 名刺は切らしておりまして 2018/08/23(木) 21:02:59.08 ID:MhFEmOhP
へろく

4: 名刺は切らしておりまして 2018/08/23(木) 21:14:52.45 ID:yErarczJ
あんなに使い難いTensor Flowを使うのは馬鹿

12: 名刺は切らしておりまして 2018/08/24(金) 00:08:55.84 ID:DYqzT3+7
>>4
そうなの?グーグルなら随時改良してくれそうだけど…

18: 名刺は切らしておりまして 2018/08/24(金) 02:14:12.72 ID:RZEWoCrP
>>12
そうだが研究者がTensorflowでコード組んで公開するんだから使わざるを得ない

5: 名刺は切らしておりまして 2018/08/23(木) 21:16:08.40 ID:on0lmb6P

ライブラリ

ただしマイナー言語、バージョンガガガ

ヨクアルハナシ

6: 名刺は切らしておりまして 2018/08/23(木) 21:16:46.40 ID:on0lmb6P
ライブラリの管理やるきないならとっととひっ下がってよいぞ
生産性の低下につながるからな

7: 名刺は切らしておりまして 2018/08/23(木) 21:17:04.20 ID:MhFEmOhP
ベニオフ15年位前に会社に遊びに来たなぁ

8: 名刺は切らしておりまして 2018/08/23(木) 21:27:06.50 ID:OgISeUyl
DEEPラーニングって対して役にたたないからみんなフレームワークづくりに逃げてるな

9: 名刺は切らしておりまして 2018/08/23(木) 21:48:34.08 ID:tRxnmvpP
>>8
役に立たないって言うよりアバウト何だよな…アバウトな原因がわからん。

10: 名刺は切らしておりまして 2018/08/23(木) 22:14:11.26 ID:MoKhijGA
>>9
誤認識した際に重大な結果を招く場合にプログラマーは責任を取りたくないのさ

13: 名刺は切らしておりまして 2018/08/24(金) 01:00:20.84 ID:q11nobrn
>>8
効率悪すぎるな

11: 名刺は切らしておりまして 2018/08/23(木) 22:57:56.34 ID:vWLs4jc/
これを導入するメリットがわからない

14: 名刺は切らしておりまして 2018/08/24(金) 01:05:46.07 ID:0DCiYSbG
機械学習ってよくわからないが、何を学習するかは人間が細かくプログラムしてやらないといけないんでしょ?

15: 名刺は切らしておりまして 2018/08/24(金) 01:14:05.01 ID:E3lTf5td
>>14
機械学習の設定をしてくれるAIを作ればいいのさ

17: 名刺は切らしておりまして 2018/08/24(金) 02:06:29.40 ID:aCVwnTRm
>>15
実際そういう方向に向かってる
まだ支援って感じだけど

16: 名刺は切らしておりまして 2018/08/24(金) 01:35:38.88 ID:PhcX7QOI
ボッキデータはみんなのもの
みんなで共用してこそ価値が高い

20: 名刺は切らしておりまして 2018/08/24(金) 04:32:42.39 ID:ZLqSmdMk
デンデンデンデデン

22: 名刺は切らしておりまして 2018/08/24(金) 09:29:50.68 ID:AmRqo+TG

いい具合に広まったら、サービス終了のお知らせ。 「クローズドな有償サービスをご利用ください」へ。

Google Earthとか、RSSとか、Java Runtimeとか。

ヤクザがシャブを売るのと同じで、最初はタダ同然で渡して、ヤク中にしてからが商売。

23: 名刺は切らしておりまして 2018/08/24(金) 21:26:09.58 ID:i/tvpfi9
Salesforceのサービスのどこで機械学習使ってんだ?
使い勝手悪くて本当に嫌い

24: 名刺は切らしておりまして 2018/08/24(金) 23:19:33.19 ID:klxGqqIG
あ? Scalaで書いてSpark上で動く?
誰が使うんだよ・・・
使ってもらいたければPythonで書いてTensorflowで動かせよ
セールスフォースは偏屈者の集まりなのか?

引用元

【IT】Salesforce、機械学習自動化ライブラリをオープンソースで公開

管理人からひと言

いいこといいこと