Organisasi
membangun ekosistem dari database mempertimbangkan kelengkapan data warehouse
tradisional dengan solusi memanfaatkan RDF. RDF merupakan solusi standar NoSQL saat
ini, karena schema-less, distributed,
sangat terukur dan sempurna untuk semantik. Database yang cocok untuk
pemrosesan tersebut adalah GraphDB dari Ontotext. GraphDB merupakan semantic database. GraphDB dapat diakses dan dikonek dengan data dari
berbagai sumber baik Content Management
System (CMS) atau internal source
seperti database enterprise
relasional. Untuk memahami GraphDB
perlu untuk memahami database “triple” store. Triple merupakan basic atom dari
data. Yang terdiri dari sebuah term yang terbentuk dari subjek-predikat-objek,
seperti Jhon has a hat. Dapat
didekomposisikan semua data kedalam bentuk record database khusus : person has a name. name is Jhon Smith, person
has a date of birth, the date of birth is 12/04/1982.
Dalam prakteknya, arti dari semantic
database adalah “triplestore”, yang dapat menyimpan dan dapat mengambil data
dari database tradisional. Semua informasi dapat disimpan dalam bentuk triple (dapat
dipecahkan kedalam bentuk atom dari makna). Jadi semantic database dapat
menyimpan berbagai jenis data. Penyimpanan secara triple bagus untuk menyimpan
text karena dapat menyimpan seluruh arti dan mengizikan untuk query.
Seperti semantic database lainnya,
GraphDB digunakan untuk query bahasa SPARQL, yang mana secara khusus untuk
menangani query yang besar pada database RDF atau sumber data yang berbeda. SPARQL
menyediakan fungsi aggregate yang sama dengan SQL, seperti operasi analitis
JOIN dan SORT, tetapi yang lebih powerful. Mungkin perbedaan terbesar dengan
SPARQL adalah hubungan data yang jelas dan cara aksesnya. Hasil query SPARQL
akan mengembalikan informasi yang mencerminkan pemahaman dari pengguna bukan
hanya struktur dari database.
GraphDB mampu melakukan query teks dan
melakukan inferencing lebih lanjut. GraphDB menerapkan aturan built-in dan
custom rule set dalam mengambil data, yang menciptakan data baru secara
otomatis. Sebagai contoh, yang mempertimbangkan dua fakta yaitu : Fido is a dog.
A Dog is a mamal. GraphDB dapat
menciptakan fakta ke tiga dengan inferencing yaitu Fido is a mamal. Hal ini
dikenal dengan sebutan forward dan backward chaining. Forward chaining adalah iteratif
yang menerapkan aturan untuk fakta yang diketahui. Backward chaining adalah mengambil
fakta yang diberikan dan menggunakan
fakta-fakta yang ada untuk membuktikan kebenarannya. Proses ini otomatis dan
fakta baru dapat dikembalikan pada saat query.
Ketika statement diubah atau diekstrak,
mesin secara otomatis menerapkan algoritma yang diperlukan untuk menemukan dan
meng-update semua inference yang terpengaruh dan memverifikasi inference yang
masih mendukung. Jenis dari reasoning yang mendukung diterapkan untuk seluruh
lifecycle dari data. Hal ini sangat penting karena fakta berubah setiap waktu. Jumlah
resource yang dibutuhkan secara manual mengatur update atau menjalankan ulang
proses inferencing akan sulit tanpa kemampuan ini. Sejauh ini, GraphDB merupakan satu-satunya
database RDF yang mendukung update inferred fakta otomatis.
Keuntungan GraphDB adalah dapat
menciptakan informasi baru, sekumpulan informasi yang dapat dipercaya dan menemukan
hubungan pada data yang sebelumnya tidak mungkin ditemukan. Secara langsung
mengintegrasikan kemampuan tekt mining kedalam triple store. GraphDB pada
dasarnya menawarkan jalur semantik untuk knowledge. Tanpa triplestore, data
yang dikembalikan dari teks mining sangat sulit untuk diatur. Dan tanpa text
mining, secara praktis tidak mungkin dengan cepat dan efektif mengekstrak makna
dari tubuh text, karena GraphDB mengsingkronisasi teks dan data secara real
time, memberikan tingkat akurasi dan konsistensi yang lebih tinggi.
GraphDB cocok untuk integrasi data dan
resolusi identitas, karena kuat digunakan untuk analisis teks dan optimal untuk
triplestore. Untuk menyelesaikan identitas disumber yang berbeda, GraphDB mengidentifikasi
dan menciptakan referensi ke entitas, kemudian
menyimpan referensi dengan cara merepresentasikan identitas duplikat salah
satunya. Memungkinkan visibilitas dan akurasi yang lebih besar serta integrasi
data dari beberapa sumber.
BBC menggunakan teknologi GraphDB
selama piala dunia tahun 2010 untuk menyediakan framework publishing semantik
dinamis, tools yang dibuat dan untuk mempublikasikan konten situs web. Institusi
pemerintahan dan penelitian juga mendapatkan keuntungan dari kemampuan semantic
search. Keduanya memiliki jutaan dokumen yang menjadi konten baik yang telah
lalu atau yang saat ini. Bayangkan jika sebuah perusahaan farmasi mampu mencari
semua komentar yang berkaitan untuk seluruh web untuk interaksi dengan obat
tertentu, dan menggabungkan hasil dengan requirment FDA dan peringatan.
Salah satu aspek powerful dari GraphDB
adalah inferencing. Mampu secara otomatis dan iterative menghasilkan fakta baru
untuk menghasilkan resolusi query dan pencarian lebih lengkap. Dengan memperluas
knowledge dan informasi diluar eksplisit data, GraphDB menyediakan pengguna
untuk mampu memulai menemukan keuntungan proses, mempercepat analisis dan
pengambilan keputusan.
Sebuah organisasi yang akan
menggabungkan dan menerbitkan data dalam jumlah yang besar harus mempertimbangkan
untuk menggunakan GraphDB. Institusi keuangan, retailer besar dan perusahaan
telekomunikasi sebagian besar bergantung pada model relasional, tetapi data web
dan eksternal data jadi lebih penting, kemampuan untuk mencari, mining dan
mengintegrasikan kedalam sistem menjadi kebutuhan strategis. Proyek integrasi
data menjadi mahal dan rumit. Solusi seperti GraphDB mengizinkan semua jenis
data yang dibawa bersama menjadi akurat dan cepat dan dilakukan pada bagian
kecil dari biaya biasa. Kombinasi dari dukungan inferensi, beban query parallel
dan frekuensi update memberdayakan pengguna untuk mengungkapkan hubungan
implisit di volume data besar yang tersebar. GraphDB benar-benar meaningful,
solusi semantik end-to-end.
Source : GraphDB: At Last, The Meaningful Database (http://ontotex.com)
0 komentar:
Posting Komentar