張東:データの最終目的は人のためのサービスです。
<p>張東のまとめ:まず価値密度です。次はデータが強(qiáng)い獨(dú)立性を持ち、共有に障害があります。最後のビッグデータはもっと多くのソースを必要とします。業(yè)界を超えて、分野をまたいでのデータ衝突こそ、大きなデータと呼ぶことができます。
</p>
<p>直面している問題について、張東さんが提出しました。一つは採取と集約の分野の問題です。二つはデータの品質(zhì)の問題とデータのフォーマットの不統(tǒng)一です。三つは政策や管理制度の制約で、多くのデータが統(tǒng)一できなくなりました。
</p>
<p>次は、波集団雲(yún)計(jì)算技術(shù)監(jiān)督の張東発言の実録です。<p>
<p>張東:ここで専門家の皆様、ご來賓の皆様と一緒に、雲(yún)の計(jì)算におけるいくつかの理念と発展?fàn)顩rを分かち合う機(jī)會(huì)を持つことができて、とても嬉しいです。
</p>
<p>前に、私達(dá)もたくさんの波が雲(yún)の計(jì)算に対する理念を話しました。業(yè)界雲(yún)について、私達(dá)は業(yè)界の中で中國(guó)の雲(yún)の計(jì)算発展を推進(jìn)してきました。業(yè)界雲(yún)はどうやって著地したらいいですか?
</p>
<p>今年のテーマはクラウドコンピューティングとビッグデータによる知恵中國(guó)推進(jìn)です。
私が今日言いたいのは、業(yè)界のクラウドから業(yè)界のビッグデータまで、ビッグデータの普及と応用の過程における挑戦と、この方面でもっと多くの業(yè)界に向かって、私たちのビッグデータ解決の道を作り出しました。
</p>
<p>これは私達(dá)が何年も続けて言っている発展の道です。一番早い段階から波の雲(yún)計(jì)算戦略、雲(yún)海戦略について話しています。雲(yún)計(jì)算の第一歩は私達(dá)の資源を集めるだけで、集める目的の一つは雲(yún)計(jì)算のメリットがあり、資源の消耗を低減し、資源の利用率を高めることができます。
しかし、より多くの私たちはどうやってこれらの資源が積まれている業(yè)務(wù)、積載されているデータを集めて、それを融合させることができますか?私たちはデータをさらに掘り下げて利用して、私たちの経済と社會(huì)サービスをより高いレベルに進(jìn)めることができます。
</p>
<p>だから、この意味では、クラウドから大きなデータまでは、実は私たちが資源を集めてデータを利用する完全なルートだと思います。
特に今では、クラウドコンピューティングはもう何年も話しました。多くのシステムも建てられたかもしれません。どのようにしてクラウドの中でデータの融合を?qū)g現(xiàn)できますか?データ間の壁を壊します。今の段階で一番重要な仕事かもしれません。
</p>
<p>したがって、データに対して、これらのデータが以前私たちがよく話したように、中國(guó)の最大の問題は情報(bào)の孤島であり、すべてのデータは異なるところに分散していて、異なるフォーマットがあり、異なる把握があれば、今私たちが話している大きなデータの発掘と応用は基礎(chǔ)がないということです。
</p>
<p>データの観點(diǎn)から見れば、雲(yún)計(jì)算と似ているかもしれません。例えば、雲(yún)計(jì)算は物理的な集中、業(yè)務(wù)の集中とデータの融合が必要です。データ発掘にとっても、最初はデータを持っている一部の人です。自分のデータを掘り起こして、自分のデータをどうやって違うユーザーとのデータの相互作用を?qū)g現(xiàn)して、最後まで本當(dāng)の意味での大きなデータを?qū)g現(xiàn)します。
</p>
<p>ビッグデータの大きさはその規(guī)模の大きさだけではなく、もっと多くの私のこれらのデータは異なるソースから來たと言っています。私自身が生み出したものがあるかもしれません。外にはたくさんの例としてインターネットを使ったものや、メディアから発生したものがあるかもしれません。
</p>
<p>業(yè)界発展の三つの段階は、組織內(nèi)部からデータの発掘と応用を行い、組織內(nèi)部の異なる業(yè)務(wù)モジュールのデータ共有と応用まで、業(yè)界を跨ぐデータ応用に至る。
</p>
<p>ビッグデータは今も何年か話していますが、インターネットの分野では確かに熱いと感じています。科學(xué)の分野では多くの専門データの人も熱心かもしれません。しかし、逆に私たちが見たこのような業(yè)界の中では、公安、工商、稅務(wù)など、多くの中國(guó)の重要な経済部門と業(yè)界部門の中で、データの応用は多くの問題に直面しています。
</p>
<p><a href=“//m.pmae.cn/news/indexuc.asp”業(yè)界のビッグデータ<a>の特徴は何ですか?簡(jiǎn)単にまとめましたが、一般的な意味でのビッグデータとはちょっと違った特徴があります。まず最初は価値密度です。
大きなデータの數(shù)Vを話す時(shí)、皆さんは値密度について言及します。データの出所が複雑で、量が多いので、価値密度が比較的低いかもしれません。もっと良い処理技術(shù)が必要です。
私達(dá)は業(yè)界の中で、その価値の密度はもっと高いかもしれないと思っています。そのデータの採集はよく目的があります。たとえば、私達(dá)は商工業(yè)でも、稅務(wù)でも、そのデータはその業(yè)務(wù)に対して採集したデータかもしれません。
このようないくつかのデータに対して掘り起こして、実はもっと大きなより良い価値を生むことができます。
</p>
<p>私たちは何をするかを知っています。みんなが最善の処理を探して、収益が早く見えるところ、例えば水のようにいつも一番落ちやすいところを探しています。
同様にこのような機(jī)會(huì)を探している時(shí)に、私達(dá)も業(yè)界の中でその大きいデータに対して掘り起こすことを通じて(通って)、もっと良い発見のこの中のいくつか機(jī)會(huì)、この中のいくつか規(guī)則を探し當(dāng)てて、もっと良いのは私達(dá)の経済のためにサービスすることができます。
</p>
<p>第二のポイントはあまり良くないです。大きなデータの共有と発掘にとっては良くない特徴だと思います。
これらの業(yè)界の中で、これらのデータはよく獨(dú)立性が強(qiáng)いです。共有させたいですが、実はたくさんの障害があります。
これらのデータを共有して総合的に処理すればいいかもしれませんが、様々な理由で管理制度上のものがあるかもしれません。これらの人の動(dòng)機(jī)やモチベーションがないから、データ共有の割合は非常に低いかもしれません。
私たちが今見ている數(shù)字はもちろん10%以下であり、さらには一部の地域のデータ共有率がより低いということもあります。また、先ほど述べた政府寄りの業(yè)界だけではなく、多くの企業(yè)內(nèi)にも存在しています。例えば、財(cái)務(wù)データと人的データは共有できないかもしれません。
</p>
<p>この中で重要な問題があります。これらのデータの所有者は往々にして違っています。所有者によって、実はこれらのデータを結(jié)びつけるのが難しいからです。
所有者のいくつかの懸念を解決したいです。例えば、一緒に置いた場(chǎng)合、秘密を漏らすことができますか?一緒に置いた場(chǎng)合、見てはいけないものや改竄がありますか?その安全性はどう保証されますか?
<p>三つ目の特徴は、大きなデータが以前のデータ分析とは大きく異なると考えています。それは業(yè)界間で私達(dá)が企業(yè)の場(chǎng)で発生したデータを含めて、総合的に分析してこそ大きなデータとなります。內(nèi)部の一つのERPの中や財(cái)務(wù)諸表の財(cái)務(wù)データを簡(jiǎn)単に持ち出して走るだけであれば、10年前、20年前に多くの人ができます。
ビッグデータは必ずより多くのソースを必要とし、業(yè)界を越え、分野を跨ぐデータ衝突は、本當(dāng)にビッグデータと呼ぶことができる。
</p>
<p>最後の一つはこれらの業(yè)界で、データの最終的な目的は前から業(yè)界のクラウドから後まで業(yè)界のビッグデータについて話します。データは最終的には必ず人のためにサービスします。すべてのものはデータサービスに変換しなければ意味がありません。でないと、これは分析しても、発掘しても、最後はあなたのデータベースに入れます。結(jié)果をみんなと共有していません。
</p>
<p>しかし、このように本來內(nèi)部のデータをサービスに転化する過程で、これらのデータは公開されてはいけない、或いは外部の人に改ざんされないようにする方法、データの信頼性、利用性はどうすればいいですか?また、この中のサービス品質(zhì)問題はどうすればいいですか?
</p>
<p>この中ではどのような問題がありますか?まず、私達(dá)はビッグデータを一つのデータの収集から集めて、最後まで分析して、決定を行います。収集、保存、分析、可視化、そして最終的な決定によってサービスを提供する過程を見せます。
各段階において、実際にはまだ多くの問題があります。大きなデータをより多くの分野に広めるためには、より多くの業(yè)界のユーザー、あるいは伝統(tǒng)的な情報(bào)化ユーザーを利用して、この問題を解決しなければなりません。
</p>
<p>最初の一つは、採集と<a href=“//m.pmae.cn/news/indexuc.asp”>で<a>領(lǐng)域の問題をまとめています。
私たちはこの一、二年の間に大きなデータの名前を持って多くのユーザーを探しました。多くのユーザーはビッグデータがとてもいいと聞きました。予算が終わったら、ビッグデータを作りたいです。彼らもとても親切です。
しかし、彼のシステムを見に行きます。まず最初に問題があります。データはどこにありますか?多くの人がやりたいことは、実際には彼がこれをするデータがありません。最初の問題はデータの収集です。多くのデータが生まれたかもしれませんが、彼にとっては有効な方法がありません。
もちろん、この集合は技術(shù)的手段の原因かもしれません。管理上の原因かもしれません。
</p>
<p class=“p 15”style=“magin-top:0 pt;magin-bottom:0 pt”><span stye=“font-famimily:“宋體”font-size:9 pt;mso-spacerun:“yes”>{pageubreak}<span>>>>“spspspand mmmmmyyyymmmmmmmzzzzzzyymmmmmmmmmmmmmmmmmmyyyyyyyyymmmmmmmmyyyyyyyyyyymmmmzzzzzzzzzzzzzzz」><o(jì):p><o(jì):p></span></p>
<p><!--EndFragment-->二つ目は、彼がいくつかのデータを集めても、それらのデータの出所は非常に複雑で、自分で作ったのかもしれません。たとえば彼は自分で採集して、マシンで採集しても、人で採集してもいいです。他の人から拷問されたものもあります。そして、これらのデータは全部良いと保証できないです。あるいは、彼の後期業(yè)務(wù)に適しています。
つまり、この中ではデータの品質(zhì)が大きな問題です。データのフォーマットが統(tǒng)一されていないのも大きな問題です。
</p>
最後に政策や<a href=“//m.pmae.cn/news/indexuc.asp>管理制度<a>に制限があり、多くのデータが統(tǒng)一できなくなりました。國(guó)內(nèi)の典型的な部門です。公安です。下級(jí)の問題は下の部門だけではなく、下の部門であるべきだと思っています。でも、このように多くの部門で発見しました。間も通じないかもしれません。
</p>
<p>最初に解決したい問題は、これらのものをどのように集約して、中にある技術(shù)の手段をまとめて解決し、私達(dá)とどうやって標(biāo)準(zhǔn)化するか、どうやって規(guī)範(fàn)化するかという問題です。
</p>
<p>二つ目の問題は、このデータがまとめられたら、問題が発生します。つまり、保存と管理の問題です。
実は多くの人が私にいい収集手段があると言っています。たくさんのカメラとセンサーがあります。しかし、これらのものが戻ってくるのは難しいです。バックグランドはそんなに大きな記憶能力がないので、二日間でもう一度転がします。
この中で、データの規(guī)模がますます膨大になるにつれて、データの種類もますます複雑になりました。畫像、ビデオがあるかもしれません。データベースの中に入れられるものがあります。データベースの中に入れられないものがたくさん保存されています。
</p>
<p>また、統(tǒng)合保存中の共有とプライバシーの問題があります。これは一人以上のユーザーのところで私たちに一つの要求を提出します。
今は統(tǒng)一した大きな池を作りました。以前のデータは全部私のところに置いています。データを彼に預(yù)けます。どう保証しますか?彼のデータは安全です。この手段を必ず與えてください。もちろん多くのユーザーが聞いているのは伝統(tǒng)的な手段です。例えば、強(qiáng)制的なアクセス制御、暗號(hào)化などですが、この中で伝統(tǒng)的な安全のいくつかの手段があります。これはクラウドモードの浸透を防止してからずっと検討しています。彼を信頼します。
</p>
<p>三つ目の問題は分析の過程で発生した問題で、前の接觸から見て、分析の過程で問題は簡(jiǎn)単に言えば二つです。
第一に、業(yè)務(wù)が分かる人はプログラムが書けないし、手続きができる人は業(yè)務(wù)が分かりません。これらの業(yè)務(wù)が分かる人の知識(shí)をコンピューターの知識(shí)に転化するのは、実は面倒くさいことです。
先ほど多くの専門家も述べましたが、今は大企業(yè)の中でやっているいくつかの試みで、人間としての顔パターンの認(rèn)識(shí)、音聲、ビデオ、オーディオなど、どのように機(jī)械を訓(xùn)練して人間の脳のように働きますか?
しかし、多くの専門分野では、実はもっと専門的な知識(shí)がたくさんあります。
例えば、行政分野は人に頼っているかもしれません。例えば、今の醫(yī)療は専門家の醫(yī)療がだんだん進(jìn)んでいると言われていますが、醫(yī)療システムの中でも同じです。
この前同僚と相談した時(shí)、みんなもこの問題について話していましたが、コンピュータのネットワークを通じて、自分の癥狀や化學(xué)検査書を持ってコンピューターに診察してもらって、今たくさんの時(shí)に直面している醫(yī)療問題を解決して、これはもう一つの話題ですが、この中で、人の経験を計(jì)算感情に変える方法は多くの人が直面しています。私たちのカメラを通して一人を監(jiān)視することは難しいです。
</p>
<p>二つ目はこの応用が複雑すぎて、以前はみんなデータ技術(shù)を使っていましたが、その後は全部データ倉庫を使って、またある日突然、Hadoopはいいものだと言われました。みんなHadoopに行きます。
すべてのアプリケーションがHadoopに適しているのではないですか?実はそうではないです。元のデータベースからHadoopに切ったらだめだと思います。また切ってしまいました。
どのように多様性が適用に適したいくつかの技術(shù)を見つけて、その根本的な問題を解決するのも今直面している課題です。
</p>
<p>最後は可視化の問題ですが、今では多くの人がpadや攜帯でこれらを表現(xiàn)することに慣れています。これも大きな問題です。
</p>
<p>前に挑戦についてお話ししましたが、後にこの仕事についてお話します。
まず、先ほどお話ししましたが、ビッグデータもクラウド全體の計(jì)算戦略の一歩前に進(jìn)みます。業(yè)界クラウドから、ユーザーの演算、資源の集め、データの分析を助けます。これは現(xiàn)在のクラウド計(jì)算の解決策です。
波はやはり私達(dá)のデータセンターの方面に集中して、一階の機(jī)械室からサーバー、ストレージまで、私達(dá)は基礎(chǔ)のシステムソフトウェアを提供して、上まで大きいデータのコンサルティングサービス、計(jì)畫のサービスなどを提供して、ユーザーにひとまとまりの雲(yún)の計(jì)算と大きいデータの體系を創(chuàng)立するように助けます。
</p>
<p>過去1年間で、クラウドコンピューティングにおいても多くの新製品が登場(chǎng)しました。私たちのモジュール化データセンターを含めて、インターネットの高密度データセンターに向かって、今はインターネット市場(chǎng)でのシェアがとても高くなりました。業(yè)界向けのビッグデータ分野などいくつかの製品が含まれています。興味があれば、私たちの展示室の紹介を見てください。
</p>
<p>先ほどのユーザ計(jì)畫クラウドの計(jì)算には一歩一歩前進(jìn)する必要があると述べましたが、前のステップはゼロから一気に3つにジャンプするということではなく、建設(shè)クラウドから徐々にデータを集めていくために、私達(dá)もユーザーに全體の建設(shè)案のコンサルティングを提供しています。
</p>
<p>具體的にはビッグデータについて、私達(dá)が提供しているプランの一つのキーワードは一體となって、私達(dá)はどうやって一體化を理解しますか?私達(dá)は三つの部分に分けて、第一に私達(dá)が前に述べたすべての処理過程の、収集、記憶、分析、可視化から、このようなシステムで解決できると思います。
第二に、波のハード面での優(yōu)位性を発揮し、ハード面での加速度を含めた全體的な性能を向上させ、現(xiàn)在の大メモリ向けの計(jì)算能力を生かし、データ処理全體の性能を向上させます。
最後に解決策の一體となり、さまざまな業(yè)界に向けて、今年のように金融業(yè)界向けの一體機(jī)を発表しました。今後は公安業(yè)界向けの一體機(jī)を発表して、全體的な解決案を作ります。
</p>
<p>最後にいくつかの解決案の例を共有します。これも実際に私達(dá)のケースです。私達(dá)はまだ建設(shè)中です。これは省レベルの公安が雲(yún)からビッグデータまでの全體例です。
前に述べたこれらの問題は先ほどすでに述べました。例えば、私達(dá)も一つの政府部門が指導(dǎo)してくれると思います。みんなは何でもやりやすいです。実際には何でもやりにくいです。
この中の多くのものは、例えばデータ共有の前に刑事、経済、戸籍、稅関、出入國(guó)は全部分離されています。データの共有度はこれまでは非常に悪く、業(yè)務(wù)システムの重複建設(shè)が深刻で、すべてのシステムは単獨(dú)機(jī)で運(yùn)行されています。データ処理能力も比較的悪いです。
</p>
<p>これは先ほど私達(dá)が言ったものです。各システムはハードウェアに対応しています。データベースに対応しています。獨(dú)立データに対応しています。応用をする時(shí)、これを応用してください。その上で走れないかもしれません。
私達(dá)が彼の底から計(jì)畫して、底の階のIaaS層を含めて、中の波に基づいて開放的なビッグデータ処理プラットフォームまで、PaaSと理解できますが、私達(dá)はまだ初歩的なデータ共有連結(jié)プラットフォームです。すべてのITシステムを一つにまとめて、実際には既存のアプリケーションに集中しています。この業(yè)務(wù)システムは動(dòng)かなくてもいいです。これを使ったら、多くのデータを共有できます。問題は、このようにして全體のクラウド計(jì)算と大きなデータのプラットフォームを形成する。
</p>
<p>これは私達(dá)の具體的な方案です。これは物理的な構(gòu)造です。統(tǒng)一的な監(jiān)視管理を通じて、全省のプラットフォームを結(jié)合しています。これは大データの面で様々なデータを処理する手段です。例えば、多くの人の戸籍情報(bào)はデータベースの中にあるかもしれませんが、多くのオーディオビデオデータがあります。データベース、Hadoopのような新しいプラットフォームを使っています。
</p>
<p>上には私たちの波の一つのデータ共有プラットフォームであり、IOPとも呼ばれています。下のすべてのクラウドデータを統(tǒng)一的に抽出し、統(tǒng)一的に処理して、上でそれを見せて、公安に向けた大きなデータ解決策を形成しています。
</p>
- 関連記事
- 文書管理 | 愛數(shù)文書クラウドプラットフォームに関する解決策
- 靴の材料 | 上質(zhì)の毛皮生産の重要な技術(shù)は毛皮動(dòng)物の養(yǎng)殖業(yè)の発展を助力します。
- 文書管理 | 愛數(shù)文書クラウド案は寧波教育學(xué)院と連攜して大學(xué)私有雲(yún)プラットフォームを構(gòu)築する。
- 國(guó)內(nèi)データ | 中國(guó)1-5月の全國(guó)規(guī)模以上の工業(yè)企業(yè)利益総額は同9.8%増加した。
- 文書管理 | 友達(dá)NC-XBRLで情報(bào)システムを開拓してプラットフォームと業(yè)務(wù)空間を建設(shè)します。
- 手提げ袋 | 2014個(gè)性的なミニ斜めショルダーバッグと超美ファッションエッセンスは春に必須です。
- 手提げ袋 | 2014新型の斜めショルダーバッグにキラキラキャンディの色が一番人気です。
- 文書管理 | エプソンDS-560高速安定ネットワークスキャン
- 文書管理 | Icloud版iwork更新支援ドキュメント設(shè)定の記憶同期
- 文書管理 | 超高速饋紙式彩色文檔網(wǎng)絡(luò)掃描儀面市
- 南昌市國(guó)家稅務(wù)局の稅務(wù)登記抹消に関する事項(xiàng)に関する公告
- ビジネスパーソンの絶妙な組み合わせが大きなカレーの雰囲気を作り出します。
- 職場(chǎng)靚麗美造型 穿出百變氣質(zhì)范兒
- Eytysとcoletteが手を組んで、新しい靴のスタイルを作り出しました。
- Gel Lyte 3全新配色鞋履登場(chǎng) 沉穩(wěn)不失森系質(zhì)感
- HUF 2010 4夏には、新しい靴シリーズが登場(chǎng)します。
- Ewing Athleticsの新しい配色はファッションの新しい主張を演繹します。
- Supremeとvansは連名でラグジュアリーシューズを発表します。
- 五月百変更衣術(shù)は完璧な視覚をもたらします。
- 夏から濕った街でショーをするスタイルが濃くて美しいです。