Bug Online

Softver - SQL Server 2008 Data Mining

Potraga za zlatom

 

U zadnjih nekoliko godina računalna snaga eksponencijalno se povećavala prema poznatom Mooreovom zakonu, ali možda je još značajnije i većini ljudi nepoznato da se kapacitet čvrstih diskova povećavao za red veličine brže od procesorske snage. Točnije, mogućnost spremanja podataka značajno nadilazi procesorsku snagu. Rezultat je pohrana velikih količina podataka u bazama podataka gdje većina dolazi iz poslovnog softvera kao što su financijske aplikacije, CRM i ERP sustavi, logovi web servera i slično. To rezultira posjedovanjem velike količine spremljenih podataka iz kojih se najčešće ne izvodi novo znanje koje bi nam potom moglo biti iskorišteno u svrhu poslovnog odlučivanja.

Rudarenje podataka je proces pronalaženja novog i potencijalno korisnog znanja iz dostupnih podataka koji su danas najčešće spremljeni u skladištima podataka. Pritom se upotrebljavaju automatizirane metodologije dubinskog pristupa spremljenim podacima i identificiraju uzorci i odnosi preko kojih se potom grade prediktivni modeli. To je ujedno i multidisiplinarno područje koje uključuje baze podataka, statistiku i umjetnu inteligenciju te zahtijeva visokoobrazovane i iskusne stručnjake (i u tehničkom i u poslovnom smislu).

SQL Server 2008 pruža zaokruženu platformu za razvoj najčešćih procesa rudaranja podataka implementirajući 10 ključnih algoritama koji pokrivaju najveći dio poslovnih procesa. Time i poslovni analitičari mogu sudjelovati u izradi prediktivnih analiza koje su prije bile namijenjene samo uskom krugu visokospecijaliziranih stručnjaka iz područja statistike i rudarenja podataka.

Ukratko, glavni je cilj rudarenja podataka izdvajanje znanja iz dostupnih podataka, izrada trendova, analiza i opisa postojećeg skrivenog znanja koje je često ključno za donošenje strateških odluka te predstavlja odlučujući faktor na vrlo konkuretnom tržištu.

 

Poslovni problemi rudarenja podataka

Rudarenje podataka moguće je koristiti u skoro svim poslovnim aktivnostima. Ono ujedno pomaže odgovoriti na prediktivna pitanja koja sežu od predviđajućeg do neregularnog ponašanja određenog promatranog objekta. Rezultat rudarenja podataka kasnije je primjenjiv u scenarijima stvaranja preporuka u odlučivanju za poduzeće ili njegovog klijenta, analizi anomalija u bankarskom poslovanju, segmentaciji korisnika u grupe prema unaprijed definiranim parametrima, analizi kreditnog rizika, predviđanju budućeg ponašanja kao i u mnogim drugim poslovnim i znastvenim analizama.

Već od SQL Servera 2005 rudarenje podataka postaje standardni modul unutar Visual Studija koji omogućava stvaranje projekata rudarenja podataka neovisno o vrsti izvora podataka (baze podataka, OLAP, tekstualne datoteke...). Osnovne mogućnosti rudarenja podataka dostupne su u Standard verziji SQL Servera, dočim je za punu funkcionalnost potrebno koristiti Developer ili Enteprise licencu.

 

Napomena: Članci iz časopisa se ne prenose uvijek kompletni, sa svim slikama, potpisima pod slike, okvirima, tablicama i sličnim. Ponekad se ne prenosi niti cijeli tekst članka. Svrha članaka na Webu jest da pruže uvid u način obrade teme i potaknu interes za proučavanjem tiskanog broja. Za cjelovit uvid u članke - savjetujemo da pogledate papirnato izdanje časopisa. Hvala.
Rudarenje podataka (engl. data mining) sastavni je i ključni dio poslovne inteligencije koji značajno povećava poslovnu vrijednost već postojećeg analitičkog sustava. SQL Server 2008 nudi zaokruženu platformu koja pruža i povezuje sve potrebne alate koji, osim ETL-a, OLAP-a i izvještavanja, nude i podršku za rudarenje podataka

izdvojeni tekstovi - ožujak 2010.

Oleg Maštruko

Frka s bandwidthom sub 20.2.2010

ISO 27001 u Konzumu

Certifikacija internetske prodavaonice sub 20.2.2010

Globalni IT

Povratak u 2008? sub 20.2.2010

Žene i IT

Informatika nije samo za muškarce sub 20.2.2010

Danijel Bačelić, General Manager, IPG Hewlett-Packard

Hrvatski kralj ispisa sub 20.2.2010

Sjena nad ADSL-om

Problemi na vidiku (ali i rješenja) sub 20.2.2010

SQL Server 2008 Data Mining

Potraga za zlatom sub 20.2.2010

Kingston SSDNow E Series SNE125-S2 64 GB

Redefiniranje brzine sub 20.2.2010

Ruckus ZoneFlex

Zrela bežična tehnologija sub 20.2.2010

Kineski napadi na Google

Google – Kina 0:1 sub 20.2.2010

Microsoft Windows Azure Tools 1.0

Tvornica oblaka sri 10.2.2010