Какво представлява голяма информация - просто обяснение с пример

Съдържание:

Какво представлява голяма информация - просто обяснение с пример
Какво представлява голяма информация - просто обяснение с пример

Видео: Какво представлява голяма информация - просто обяснение с пример

Видео: Какво представлява голяма информация - просто обяснение с пример
Видео: Операционные системы написанные на Pascal, Delphi, Lazarus IDE, FreePascal, Turbo Pascal, Modula-2 - YouTube 2024, Ноември
Anonim

Терминът Голяма информация се използва все повече почти навсякъде на планетата - онлайн и офлайн. И това не е свързано само с компютрите. Тя е част от един озаглавен термин, наречен Информационни технологии, който сега е част от почти всички други технологии и области на обучение и бизнес. Big Data не е голяма работа. Обществото, което го заобикаля, е сигурно доста голяма работа, за да ви обърка. Тази статия разглежда какво е Big Data. Той също така съдържа пример за това как NetFlix използва данните си, или по-скоро Big Data, за да обслужва по-добре нуждите на клиентите си.

Image
Image

Какво е Big Data

Данните, намиращи се в сървърите на фирмата ви, бяха само данни до вчера - подредени и подадени. Изведнъж жаргонът Big Data стана популярен и сега данните във вашата компания са Big Data. Терминът обхваща всяко отделно данни, съхранена досега от организацията ви. Той включва данни, съхранявани в облаци, и дори URL адресите, които сте маркирали. Вашата фирма може да не е цифровизирала всички данни. Вероятно вече не сте структурирали всички данни. Но след това всички цифрови, документи, структурирани и неструктурирани данни с вашата фирма сега са големи данни.

Накратко, всички данни - независимо дали са категоризирани или не - присъстват на вашите сървъри, се наричат колективно BIG DATA. Всички тези данни могат да се използват за получаване на различни резултати, използвайки различни видове анализ. Не е необходимо всички анализи да използват всички данни. Различният анализ използва различни части от BIG DATA, за да се получат необходимите резултати и прогнози.

Големите данни са по същество данните, които анализирате за резултати, които можете да използвате за прогнози и други употреби. Когато използвате термина "Големи данни", внезапно фирмата или организацията ви работят с най-високо ниво на информационните технологии, за да извлекат различни видове резултати, като използват същите данни, които сте съхранявали умишлено или непреднамерено през годините.

Колко големи са големи данни

По същество всички данни се комбинират с Big Data, но много изследователи се съгласяват, че Големите данни - като такива - не могат да бъдат манипулирани с помощта на нормални електронни таблици и редовни инструменти за управление на бази данни. Те се нуждаят от специални инструменти за анализ като Hadoop (ще проучим това в отделен пост), така че всички данни да могат да бъдат анализирани наведнъж (може да включва итерации на анализ).

Противно на гореизложеното, макар че не съм експерт по въпроса, бих казал, че данни с всяка организация - голяма или малка, организирана или неорганизирана - е Големи данни за тази организация и че организацията може да избере свои собствени инструменти, за да анализира данни.

Обикновено, за анализиране на данните, хората са създавали различни набори от данни, базирани на едно или повече общи полета, така че анализът става лесен. В случай на Big Data, няма нужда да създавате подгрупи за анализа. Сега разполагаме с инструменти, които могат да анализират данните, независимо колко огромни са. Вероятно тези инструменти сами категоризират данните, дори когато анализират данните.

Смятам за важно да спомена две изречения от книгата "Big Data" на Джими Гутерман:

Big Data: when the size and performance requirements for data management become significant design and decision factors for implementing a data management and analysis system.”

-и-

“For some organizations, facing hundreds of gigabytes of data for the first time may trigger a need to reconsider data management options. For others, it may take tens or hundreds of terabytes before data size becomes a significant consideration.”

Така че виждате, че обемът и анализът са важна част от Big Data.

Прочети: Какво е Data Mining?

Големи концепции за данни

Това е друг момент, в който повечето хора не са съгласни. Някои експерти казват, че големите концепции за данни са три V:

  1. Сила на звука
  2. скорост
  3. разнообразие

Някои други добавят още няколко V към концепцията:

  1. Визуализацията
  2. Veracity (Надеждност)
  3. Променливост и
  4. стойност

Аз ще покрия понятията "Big Data" в отделна статия, тъй като тази публикация вече е голяма. По мое мнение, първите три V са достатъчни, за да обяснят концепцията за Big Data.

Големият пример за данни - как NetFlix го използва, за да поправи проблемите си

Към 2008 г. имаше прекъсване в NetFlix, поради което много клиенти останаха на тъмно. Докато някои все още могат да имат достъп до услугите за стрийминг, повечето от тях не могат. Някои клиенти успяха да си наемат DVD-та, докато други не успяха. Блог пост на Уол Стрийт Джърнъл казва Netflix току-що стартира по поръчка.

Прекъсванията накараха ръководството да обмисли възможните бъдещи проблеми и оттук нататък; се обърна към Биг Дан. Той анализира големи зони на трафик, податливи точки и пропускателна способност на мрежата и т.н., използвайки тези данни, и работи върху него, за да намали прекъсванията, ако възникне бъдещ проблем, тъй като той стана глобален. Тук е връзката към блога на Wall Street Journal, ако искате да разгледате примерите за Big Data.

Горното обобщава какво е "Голямата информация" на език на простия. Можете да го наречете като много основно въведение. Аз планирам да напиша още няколко статии за свързани фактори като - концепции, анализ, инструменти и приложения на Big Data, Big Data 3 V и т.н. Междувременно, ако искате да добавите нещо към горното, коментирайте и споделете с нас.

Препоръчано: