twitter
    Find out what I'm doing, Follow Me :)

Translate Chapter 4

Penamaan, pada akhirnya, adalah satu set pengaturan kontrak sosial. Kami seharusnya tidak membiarkan sifat virtual dunia maya membutakan kita pada fakta ahwa orang-orang meminta dan membayar, dan mendapatkan diberikan, nama domain dan ruang ada server.

4.1.1 Struktur Web

investigasi Topological upaya untuk memahami struktur dari dasar unsur-unsur arsitektur dan hubungan antara mereka. Struktur dapat memberi tahu kita banyak. Penyelidikan struktur dari Web adalah selalu tergantung pada tingkat abstraksi dari deskripsi saja. tingkat makro. O (n log n) di ruang masalah kebanyakan, pada skala Web log n istilah bisa mulai untuk mendapatkan lumayan besar [191]. pada sifat global dari Web. Oleh karena itu pemahaman struktur adalah penting untuk sejumlah aplikasi, seperti navigasi, pencarian, menyediakan sumber daya untuk mendukung komunitas online, atau ameliorating Web adalah demokratis sejauh bahwa tidak ada sentralisasi atau pusat koordinasi menghubungkan. Dipahami sebagai struktur hypertext, rantai halaman buruk terkait mengarah pada disorientasi terkenal Setelah rantai link adalah juga diberikan kurang berisiko oleh Web browser yang berisi ‘kembali’ tombol, Dan navigasi tidak perlu hanya menjadi santai berjalan seenaknya sekitar rantai hyperlink, terima kasih pengguna. Apakah Sebagai contoh, mungkin itu mungkin untuk pengetahuan peta di theWeb? atau rumor, atau Factoid, atau teori, dari perkecambahan membuahkan hasil, atau sebaliknya sebaliknya, dengan menelusuri cara itu muncul dalam berbagai halaman dan link mereka [5]. surge (yang memperlambat atau penutupan sebuah website setelah baru dan besar Populasi pengguna mengikuti link untuk itu dari sebuah website populer, sebagaimana telah terjadi dari situs dari majalah online Slashdot) sebelum mereka terjadi – atau setidaknya mampu mengintervensi cukup cepat untuk memulihkan normal atau jasa dapat diterima segera setelah itu. Memang, kita bahkan mungkin Banyak menulis tentang Web tampaknya menunjukkan bahwa, di beberapa cara, hidup, berkembang dan di luar kendali [misalnya kontrol.

4.1.2 Grafik-teori investigasi

Mungkin paradigma yang paling terkenal untuk mempelajari Web adalah grafik teori. Web dapat dilihat sebagai grafik yang node halaman dan yang (diarahkan) tepi adalah link. Karena weblinks sangat sedikit acak, jelas bahwa tepi grafik mengkodekan struktur banyak yang terlihat oleh desainer dan penulis konten yang sama pentingnya. Sangat tersambung bagian webgraph yang sesuai dengan apa yang disebut cybercommunities masih sesuatu yang seni, dan bisa kontroversial - pendekatan yang sering Konektivitas webgraph telah dianalisis secara rinci, menggunakan struktural seperti indikator seperti bagaimana node yang terhubung. merangkak dari lebih dari 200 juta halaman menemukan bahwa 90% dari Web sebenarnya tersambung, jika link diambil sebagai non-directional, dan bahwa 56m dari halaman ini sangat sangat berhubungan [49] cf. [80].

pada Gambar 4.1. The ‘simpul’ dasi adalah sangat berhubungan cluster node.

Hubungan antara SCC, IN dan OUT memberikan bentuk bowtie. Implikasi dari penemuan ini masih topologi perlu dipahami. Meskipun beberapa telah mengusulkan perubahan terhadap terlihat. Memang, struktur bowtie adalah lazim di berbagai skala. Dill di al telah menemukan bahwa himpunan bagian yang lebih kecil dari Web juga memiliki

Gambar. karakteristik sebagai Web pada umumnya [78].

tersambung berarti bahwa subgraph disebabkan oleh satu set acak node akan hampir kosong, tetapi jika kita mencari kelompok non-acak Setiap TUC akan SCC yang lebih luas. kemudian dapat bertindak sebagai tulang punggung navigasi antara TUCs. Dengan cara ini sifat fraktal dari Web memberi kita indikasi terlalu banyak koneksi TheWeb berkembang sebagai akibat dari sejumlah dasarnya proses stokastik independen yang berevolusi pada berbagai skala, yang mengapa sifat struktural tetap konstan seperti yang kita perubahan skala. proses stokastik [78].

Ada beberapa metrik yang tersedia untuk teori grafik ([40] dan lihat [76] untuk survei terbaru). langkah-langkah Sentralisasi memberitahu kita bagaimana tersambung sebuah node dibandingkan dengan node lain grafik, dan karena itu dapat membantu memberitahu kita mana yang paling “pusat” node. Jumlah jarak ke node (dalam jarak), dinormalkan untuk ukuran grafik itu sendiri, dapat menjadi informatif. Sebuah node sentral akan menjadi salah satu yang memiliki relatif rendah total masuk dan keluar jarak, dalam kontras node terkubur jauh dari node pusat kurang mungkin dicapai oleh suatu rantai link. Pusat pengetahuan tersebut node berguna untuk mencapai poin sewenang-wenang dalam grafik [76]. Kekompakan adalah ukuran tentang bagaimana terhubung grafik, sebuah Ukuran biasa memiliki jangkauan antara 0 (benar-benar terputus node) dan 1 (sambungan universal). Kurang jelas grafik tidak boleh terlalu kompak baik, jika penulis halaman Web yang hemat dan bijaksana tentang apa yang mereka link ke, mereka link yang lebih mungkin untuk digunakan. Saldo adalah properti dari sebuah node individu perkembangan ide-ide dalam sumber daya, dan oleh karena itu jika beberapa dari maka mungkin saja kasus yang menunjukkan mantan sangat baik dikembangkan topik sementara yang kedua dapat ditingkatkan dengan penambahan lebih lanjut. Meskipun pengguna individu orang berperilaku sebagai maximisers utilitas. Dalam hal ini, pemahaman insentif yang tersedia bagi pengguna Web harus menyediakan metode untuk mendukung perilaku tersebut. dikenakan baik oleh arsitektur, protokol dan standar, dan mereka interaksi dengan sifat sosial atau psikologis dari pengguna atau desainer (Memang, hal ini bisa dibilang fakta bahwa Web dibangun, dikelola dan digunakan oleh paradigma / ekonomi teori permainan). utilitas kebebasan yang desentralisasi telah menghasilkan? Sebagai meningkatnya jumlah pengguna, akan kemungkinan bahwa pilihan yang satu membuat menimpa pada berbagai pilihan yang tersedia untuk meningkatkan orang lain, atau parameter? Jawaban untuk pertanyaan itu, bagaimanapun matematika, akan Dengan kata lain, apa Dalam Web desentralisasi dan berkembang, di mana tidak ada “pemilik” seperti itu, kita bisa yakin bahwa keputusan yang membuat Situasi seperti ini, yang dikenal sebagai ‘tragedi milik bersama “, terjadi di peer tekanan dan prinsip-prinsip moral. Itu meningkat baik untuk pemilik individu pemilik semakin banyak adalah, dan semua hal yang sama dengan lebih kaya set link besarnya penggunaan. Penyambungan. A langsung yang memilikinya – telepon dan email menjadi contoh utama. Secara intuitif, kita dapat melihat bahwa model pasar untuk barang-barang tersebut bermasalah, sebagai lebih dini di pasar akan melambung, jika tidak. ‘Cukup’ di sini? Memasukkan lebih teknis, apa artinya ini adalah bahwa pasar

Karena jumlah pengadopsi (Ukuran jaringan) meningkat, kesediaan marjinal konsumen membayar meningkat karena keuntungan yang lebih besar akan mereka terima dari layanan untuk harga yang diberikan – keuntungan, ditentukan oleh tindakan pihak ketiga daripada kedua pihak transaksi yang sebenarnya, adalah jaringan. Jadi, misalnya, mempertimbangkan layanan VOIP berlangganan dengan gratis panggilan ke sesama pelanggan. Sejumlah kecil pelanggan umumnya mengurangi nilai pelayanan kepada pengguna potensial, tetapi jika kita asumsikan harga tetap stabil, jika meningkatnya jumlah pengguna, jumlah orang siap untuk membayar harga akan meningkat, dan akan ada saleh lingkaran pertumbuhan. Namun, mereka bergabung nantinya akan mereka mereka tidak terlalu memiliki banyak kebutuhan untuk VOIP. Jadi di beberapa titik maksimum akan tercapai, bahkan ketika jaringan sangat besar, dengan banyak kemungkinan komunikasi, tidak akan menarik pengguna baru apapun tanpa menurunkan harga. layanan online Banyak struktur jaringan, Menafsirkan grafik inWeb istilah ini, ‘jaringan ukuran’ bisa diberi glos sebagai ‘jumlah node dalam webgraph yang’ atau ‘jumlah link’ alternatif. ‘Kesediaan untuk membayar’ mengacu pada biaya yang pengguna Web adalah siap menyerap. kurva belajar yang terkait dengan formalisms tertentu atau aplikasi, sistem aman. ‘User’ itu yang dimaksud juga akan bervariasi: grafik bisa merujuk ke pengguna web biasa (konsumen konten, yang biaya Sebuah paradigma penting kedua adalah bahwa pencarian informasi. IR adalah fokus untuk perlombaan senjata antara algoritma untuk mengekstrak informasi dari repositori yang kedua repositori mendapatkan lebih besar dan lebih kompleks, dan tuntutan pengguna lebih sulit untuk memuaskan (baik dalam hal respon waktu atau kompleksitas dari query). Satu masalah yang jelas berkenaan dengan IR melalui Web adalah bahwa Web

tidak memiliki otoritas QA. Siapapun dengan account ISP dapat menempatkan halaman di krangnya ketat terkendala representasi pengetahuan. Memahami persis informasi apa yang tersedia pada halaman yang menunggu untuk diambil tetap menjadi masalah serius.

Struktur berbasis pencarian Hasil IR yang benar-benar dibawa ke dalam usia pencarian Web adalah penemuan bahwa adalah mungkin untuk membuat perbedaan heuristik antara link tersebut yang muncul untuk menunjukkan kualitas terkait-ke situs, dan mereka yang tidak [171, 221], hanya berdasarkan perhitungan nilai eigen matriks yang berhubungan dengan struktur link subgraphs lokal. Juga tidak HITS algoritma juga tidak Kleinberg Page et al PageRank dibutuhkan dalam lain masukan dari struktur dinyatakan uninterpreted dari hyperlink ke dan dari halaman Web.

4.2.4 Matematika metode untuk menggambarkan struktur

Oleh karena itu menyediakan peta jalan untuk ekstensi untuk theWeb. Yang penting dalam empat puluh turun di setiap saat satu. Kontribusi terhadap toleransi kesalahan. Sebagai contoh telah ditunjukkan bahwa untuk Sebagaimana telah kita lihat, pada asumsi bahwa Web fragmen (walaupun [63] difokuskan pada menunjukkan ketahanan Internet secara keseluruhan). jaringan skala bebas masih menyisakan cluster dihubungkan kompak [21].

4.2.5 Matematika metode untuk menggambarkan layanan

Sebagai Web berkembang untuk memasukkan model layanan, di mana perangkat lunak agen dan layanan Web akan hidup online dan dipanggil oleh pengguna, dan di mana metafora yang semakin penting adalah bahwa klien menghubungi teori menjadi berguna untuk menggambarkan hubungan ini. pengertian concurrency dengan ide dari mesin negara, dan telah disarankan sebagai sarana penting model layanan Web [296]. Pro- pengolahan. Mereka menyediakan sebuah array konstruksi untuk model dinamika pengolahan informasi dan komunikasi output dan meminta input, seperti kebijakan, urutan tindakan, fungsi pilihan, proses Salah satu perkembangan terbaru adalah π-kalkulus (bernama analogi ke proses-proses. The π-kalkulus sengaja minim (mengandung sedikit lebih pemrograman konstruksi [204, 1]. Sebagaimana telah kita lihat (Bagian 3.3.1) ada kebutuhan untuk bahasa untuk menggambarkan layanan web (seperti CDL atau BPEL), dan mungkin bahwa matematika yang tercantum di sini bisa mendukung bahasa tersebut. Ada hidup perdebatan tentang jala Petri dan π-kalkulus [24], berfokus pada manfaat relatif dari, jaring negara berbasis grafis, dan semakin tekstual,

Translate Chapter 3

Pelacakan pengembangan Web, yang menentukan inovasi
baik (misalnya P2P) dan yang buruk (phishing misalnya), dan memberikan kontribusi bagi
perkembangan menguntungkan adalah kunci bertujuan Ilmu ofWeb. Pada bagian ini, kita
akan meninjau beberapa petunjuk saat pembangun Web. Kami
akan melihat Web Semantic dan beberapa isu dan kontroversi
sekitarnya yang (Bagian 3.1), masalah berkaitan dengan referensi dan identitas
(Yang penting untuk Web Semantic untuk memastikan, tetapi juga untuk setiap
jenis analisis informasi berbuah – Bagian 3.2), dan kemudian pilihan
inisiatif lebih lanjut, termasuk layanan Web, P2P, komputasi grid dan
sebagainya (Bab 3.3).
3.1 Web semantik
Web adalah arsitektur berprinsip standar, bahasa dan
formalisms yang menyediakan platform untuk aplikasi heterogen banyak
subpopulasi. Hasilnya bisa mudah menjadi kusut, dan keputusan yang dibuat tentang
standar yang mengatur satu formalisme dapat memiliki konsekuensi di luar,
yang dapat timbal tentu saja untuk keputusan desain yang kompleks (cf. [146]). Memang,
beberapa tuntutan di Web membuat godaan untuk model yang
163,1. Web semantik 17
semantik dengan formalisms sangat ekspresif, namun expressivity seperti
perdagangan umum off melawan kegunaan dan satu set kecil baik dipahami
prinsip-prinsip.
Namun, sering terjadi bahwa trade-off antara expressivity
dan kegunaan adalah akibat dari penyalahgunaan umum dari formalisms tersebut. Untuk
contoh – kita akan membahas contoh ini secara lebih rinci di bawah ini – menggunakan
dari mesin, diimplementasikan dan diusulkan, dari Web Semantic
[35, 17] untuk memperpanjang Web merupakan tujuan umum. Tapi desain
SW dan terkait formalisms dan alat-alat dimaksudkan untuk memperpanjang
Web untuk menutupi data terkait, tidak, seperti yang sering diasumsikan, untuk meningkatkan pencarian
atau mendapatkan kekuatan yang lebih besar dari teks beranotasi (yang lain, terpisah,
jenis ekstensi dari Web).
Ini mungkin, sebagai klaim banyak dan berharap, bahwa lokal model dan muncul
semantik merupakan bagian penting dari cara kita memahami
Web. Jika demikian, akan ada serius trade-off dengan interoperabil-
ity: manfaat dari pencarian didistribusikan terstruktur dan berbagi data
besar namun memerlukan semantik interoperable. Meninggalkan semantik underde-
termined berarti memaksa pengguna (manusia) untuk melakukan pembuatan rasa, seperti untuk
Misalnya dengan sistem P2P saat ini yang, jika mereka memaksakan semantik di
semua, cenderung hanya menggunakan sangat sederhana, tingkat rendah, struktur tugas-relatif. Dalam
tertentu, asumsi bahwa aparat dari Web Semantic adalah
dirancang untuk memperpanjang teknologi yang tersedia untuk melihat dokumen
dapat menyebabkan khawatir tentang trade-off antara Seman “mudah” muncul-
tics dan “sulit” logika yang salah, kita harus berhati-hati untuk tidak
bingung dua area aplikasi terpisah.
3.1.1 Web Semantic
Web memulai hidup sebagai upaya untuk membuat orang untuk mengubah mereka
perilaku dalam cara penting. Banyak orang membuat dokumen, namun
Web pra-asumsi bahwa dokumen adalah swasta prop-
kemiskinan dari penciptanya, dan keputusan untuk mempublikasikan miliknya nya atau sendirian.
Selain itu, teknologi untuk memungkinkan orang untuk menerbitkan dan dissemi-
dokumen nate murah dan mudah sangat kurang. Tujuan Web adalah
untuk mengubah perilaku yang radikal dan menyediakan teknologi untuk melakukannya:
orang akan membuat dokumen mereka tersedia bagi orang lain dengan menambahkan links18 Rekayasa Web
untuk membuat mereka dapat diakses dengan mengikuti link. Pesatnya pertumbuhan theWeb,
dan cara di mana perubahan ini cepat diadopsi di semua sektor
masyarakat Barat mungkin mengaburkan radikalisme dari langkah ini.
Web Semantik (SW) merupakan upaya untuk memperluas potensi
Web dengan ekstensi analog perilaku orang. SW
mencoba untuk membuat orang untuk membuat data tersedia untuk orang lain, dan menambahkan
link untuk membuat mereka dapat diakses dengan mengikuti link. Jadi visi
SW adalah sebagai perluasan dari prinsip-prinsip Web dari dokumen untuk data. Ini
ekstensi, jika hal itu terjadi dan diterima, akan memenuhi lebih dari Web
potensial, dalam hal ini akan memungkinkan data yang akan dibagi secara efektif dengan yang lebih luas
masyarakat, dan untuk diproses secara otomatis oleh alat serta
manual [34]. Hal ini tentu saja menciptakan suatu persyaratan besar: seperti alat-alat harus
dapat memproses data dalam format bersama heterogen, berkumpul
menggunakan prinsip yang berbeda untuk berbagai tugas utama. The Web
kekuasaan akan yang jauh lebih besar jika data dapat didefinisikan dan terkait sehingga
bahwa mesin bisa melampaui tampilan, dan bukannya mengintegrasikan dan alasan
tentang data berbagai aplikasi (dan di seluruh organisasi atau masyarakat
batas). Saat ini, Web yang sangat tidak baik pada teks, musik dan
gambar, dan boleh juga di video dan jasa, namun data tidak dapat dengan mudah
digunakan pada skala Web [135]. Tujuan dari SW adalah untuk memfasilitasi menggunakan
data serta penemuan mereka, melampaui Google dalam hal ini.
Dalam konteks ini adalah layak disebut perbedaan antara
pengambilan informasi dan pengambilan data (alias otomatis pertanyaan-
menjawab). Tujuan yang pertama adalah untuk menghasilkan dokumen yang
relevan dengan query; dokumen ini tidak perlu menjadi unik, dan dua
episode berhasil pencarian informasi tetap dapat menghasilkan
hasil yang sama sekali berbeda. Tujuan yang terakhir adalah untuk menghasilkan
benar jawaban query. Ada perbedaan besar antara
dua jenis pencarian, dan kepatuhan ketat terhadap prinsip-prinsip formal
bahwa proyek terakhir membutuhkan mungkin menjadi penentu utama dari apa yang
struktur seseorang harus pilih ketika salah satu adalah menemukan skema untuk memberikan
signifikansi istilah dalam kueri seseorang. Data dalam arti yang sangat nyata
lebih fundamental dari sebuah dokumen, maka potensi kenaikan
Web kekuasaan. Ada juga banyak data di luar sana.
Masalah terbuka kedua adalah apa fungsi dapat dicapai
dengan membawa keluar hubungan antara berbagai data sources.3.1. Web semantik 19
Secara tradisional, di AI misalnya, basis pengetahuan atau sistem pakar,
atau bahkan database dalam sebuah organisasi, yang digunakan untuk mewakili certi-
fied informasi yang handal, dapat dipercaya, mungkin konsisten dan
sering didasarkan pada strategi akuisisi terpusat dan representasi
protokol. Di Web, tentu saja, asumsi ini tidak selalu
berlaku. Sebagai contoh, kita harus memastikan bahwa inkonsistensi (yang kita
harus berharap menemukan di Web) tidak menggelincirkan semua kesimpulan dari
kelompok tertentu sumber-sumber pengetahuan yang saling tidak konsisten. Banyak
aplikasi untuk SW belum mulai beroperasi, tetapi beberapa cara
datang untuk berdamai dengan potensi scruffiness bahkan baik terstruktur
data dari beberapa sumber adalah sebuah isu [278].
Strategi SW berikut, oleh karena itu, adalah untuk menyediakan umum
kerangka kerja untuk pembebasan data, berdasarkan deskripsi Resource-
tion Framework (RDF), yang mengintegrasikan berbagai aplikasi
menggunakan XML sebagai pertukaran sintaks [195]. Raw data dalam database
dibawa bersama-sama, dan terhubung ke model dunia (melalui
ontologi – lihat di bawah), yang kemudian memungkinkan agregasi dan analisa
data dengan memproduksi interpretasi konsisten di seluruh heterogen
sumber data. fokus, oleh karena itu, pada data itu sendiri. SW ini tidak
hanya masalah menandai dokumen HTML di Web, ataupun
varian pada masalah IR tradisional pengambilan dokumen. Ini adalah
berusaha untuk membawa bersama data di seluruh Web sehingga membuat luas
database melampaui komponennya, yang membuat aplikasi mungkin-
tions yang menyimpulkan seluruh data heterogen, seperti CS AKTive Space
yang memungkinkan browsing dan kesimpulan di berbagai sumber data
kronik keadaan disiplin ilmu komputer di Amerika
Kerajaan [251].
Model SWdata sangat berhubungan dengan dunia relasional
data (di mana data direpresentasikan sebagai hubungan n-ary, yang sesuai
ke sebuah meja – [62]), begitu dekat memang bahwa ada langsung
pemetaan dari database relasional untuk RDF. Sebuah database relasional adalah
tabel yang terdiri dari catatan, yang merupakan baris. Setiap record
terdiri dari ladang, yang analog dengan kolom, dan seorang individu
catatan tidak lebih dari isi dari bidangnya (isi
sel-sel dari matriks yang jatuh dalam baris). Catatan node RDF,
bidang adalah properti RDF dan bidang rekaman nilai [28] .20 Rekayasa Web
Jadi, misalnya, seperti meja mungkin merepresentasikan data tentang mobil. Setiap
baris (record) akan terkait dengan mobil tertentu, dan setiap kolom
beberapa properti atau lapangan (warna, pemilik, nomor registrasi, jenis, baru-baru ini
mekanik sejarah dan sebagainya). Jadi beberapa properti tertentu dari mobil
diwakili dalam merekam akan diwakili dalam rekaman yang sesuai
lapangan. Tabel tersebut juga mungkin berisi informasi tambahan yang lebih sulit untuk
mengungkapkan dalam RDF atau dalam model relasional itu sendiri. Misalnya, Mas-
Negara sachusetts mungkin memiliki database relasional mobil yang mencakup
bidang untuk pelat Massachusetts. Dalam hal ini, database mungkin
dimaksudkan untuk menjadi definitif, yaitu mobil direpresentasikan dalam database
jika dan hanya jika memiliki plat Massachusetts hukum. Itu tentu saja suatu
harta penting dari meja [28].
Semacam ini database adalah jenis sumber pengetahuan yang eksploitasi
tion dipahami sebagai dasar untuk SW. Jadi SW adalah perpanjangan
dari WWW dalam hal yang menjadi tahap berikutnya menghubungkan – menghubungkan
data tidak dokumen. Ini bukan satu set metode untuk secara khusus menangani
dokumen yang saat ini di Web, bukan seperangkat kesimpulan
metode berdasarkan metadata atau cara mengelompokkan halaman web saat ini,
atau cara super-pintar pencarian. Hal ini dimaksudkan untuk berfungsi dalam
konteks model relasional data.
Menghubungkan adalah kunci untuk SW tersebut. Secara khusus, meskipun penerbitan
data dan penggunaan RDF sangat penting, dalam banyak kasus praktek
telah menjadi konversi data ke RDF dan publikasi yang bercerai
dari dataflow dunia nyata dan manajemen. Bahasa, metode
dan alat-alat yang masih terguling keluar untuk lapisan SW, demi lapis, dan
mungkin mengherankan bahwa menang cepat tidak muncul dari publi-
kation RDF sebelum alat untuk melihat, query dan manipulat-
database ing telah mencapai pasar. Memang, sebagai data publikasi
sering menghapus data dari konteks organisasi, situasi baru
bagi banyak akan tampak lebih buruk dari era pra-SW: aplikasi dan
organisasi-spesifik alat untuk memanipulasi data yang telah berevolusi dengan
organisasi akan telah menyediakan banyak fungsi yang mungkin
telah hilang atau terkikis. Sementara itu, kurangnya menghubungkan antara data
potensi merusak yang lebih besar dari SW.
Lapisan berikutnya dari SW adalah Web Ontologi Bahasa OWL
[198], yang menyediakan sarana ekspresif dapat terhubung data ke world3.1. Web semantik 21
Gambar. 3.1 Lapisan dari Web Semantic.
(Seperti juga melakukan RDF RDF Schema atau-S – [44]). RDF dan OWL memungkinkan
pertukaran data dalam konteks dunia nyata, di atas inti ini akan
duduk bahasa query untuk RDF yang akan memungkinkan didistribusikan dataset untuk
di-query dengan cara yang standar dan dengan beberapa implementasi.
SPARQL memungkinkan interogasi dataset digabungkan untuk memberikan
akses ke informasi gabungan mereka [232].
Visi asli dari SW telah dirumuskan dalam bentuk terkenal
berlapis diagram ditunjukkan pada Gambar 3.1. Seperti dapat dilihat, pengembangan
Proses SW bergerak ke atas, dengan perhubungan / RDF OWL di
tengah. RDF seperti yang tercantum duduk di atas XML, dan tingkat terendah dari semua adalah
bahwa dari Uniform Resource Identifier (URI). Dalam ayat berikutnya
kita meneliti peran mendasar bahwa URI bermain di SW vision.22 Rekayasa Web
Gambar. 3.2 Semantic Web Stack c.2006.
Visi telah bergerak dengan upaya pelaksanaan, sebagai salah satu
harapkan. Setelah implementasi ontologi menggunakan OWL,
perhatian beralih ke bahasa aturan layer dan sesuai untuk
menyatakan aturan; pemikiran terkini menunjukkan bahwa Interchange Peraturan
Format (RIF) saat ini dalam pengembangan [112] harus duduk bersama
OWL sebagai perpanjangan RDF-S. Lapisan tersebut tercakup dalam
bahasa query SPARQL. Visi revisi SW stack, bersama-sama
dengan pengakuan akan kebutuhan user interface yang efektif dan aplikasi-
tions, ditunjukkan pada Gambar 3.2.3.1. Web semantik 23
3.1.2 URI: Nama atau alamat? Atau keduanya?
RDF didasarkan pada identifikasi sumber daya melalui URI, dan menggambarkan
mereka dalam hal sifat dan nilai properti [195]. Membandingkan
RDF dengan XLink, bahasa menghubungkan untuk XML, yang menyediakan beberapa
informasi tentang link tetapi tidak memberikan rujukan eksternal untuk
apapun sehubungan dengan yang link relevan. Sebaliknya, RDF
memberikan URI khusus untuk hal-hal pribadi, seperti yang kita lihat di bawah ini
contoh. Ketika kami membuat grafik RDF node dan busur (Gambar 3.3),
kita dapat melihat bahwa URI bahkan digunakan untuk hubungan. Sebuah referensi URI
digunakan sebagai node dalam sebuah grafik RDF mengidentifikasi apa yang mewakili node;
URI digunakan sebagai predikat suatu mengidentifikasi hubungan antara hal-hal
diidentifikasi oleh node yang terhubung [172].
http://www.w3.org/2000/10/swap/pim/contact # orang
http://www.w3.org/2000/10/swap/pim/contact # nama lengkap
http://www.w3.org/2000/10/swap/pim/contact # kotak
http://www.w3.org/2000/10/swap/pim/contact # personalTitle
mailto: em@w3.org
Eric miller
Dr
http://www.w3.org/1999/02/22-rdf-syntax-ns # jenis
http://www.w3.org/People/EM/contact # saya
Gambar. RDF 3.3 grafik yang menunjukkan URIs.24 Rekayasa Web

RDF <: RDF xmlns: RDF = “http://www.w3.org/1999/02/22-rdf-syntax-ns #”
xmlns: kontak = “http://www.w3.org/2000/10/swap/pim/contact #”>

Eric Miller Dr
Secara umum, menggunakan URI untuk mengidentifikasi sumber daya merupakan faktor penting

dalam pengembangan Web [33]. Menggunakan sintaks penamaan global con-
pernah ditemukan (namun sintaks qua sewenang-wenang) memberikan efek jaringan global,
dari mana manfaat dari berasal Web; URI memiliki lingkup global dan
diinterpretasikan secara konsisten di seluruh konteks. Bergaul dengan URI
sumber daya harus terjadi jika ada cukup mungkin ingin link ke sana,
lihat atau mengambil representasi itu [155].
Hubungan, diidentifikasi dengan URI, link sumber daya yang juga diidentifikasi-
fied oleh URI. Untuk mendapatkan mesin-pembacaan yang dimaksudkan SW
aman, maka mesin harus bisa mendapatkan pada hubungan,
dan karenanya harus dapat dereference URI yang mengidentifikasi
relasi dan mengambil sebuah representasi dari sumber daya diidentifikasi. Jika
informasi yang relevan tentang hubungan (misalnya, properti pembatasan
tions) juga tersedia di URI, maka mesin akan dapat
membuat kesimpulan mengenai hubungan menegaskan. RDFS dan semakin com-
OWL kompleks memungkinkan pernyataan dari pembatasan hak kekayaan yang pada gilirannya memungkinkan mesin untuk membuat kesimpulan dengan cara ini. Dengan cara ini, SW ini diperkuat oleh URI, penggunaan URI memungkinkan mesin untuk proses
data secara langsung memungkinkan pergeseran penekanan dimaksudkan dari dokumen
data. Kami mencatat di atas bahwa banyak inspirasi bagi SW datang
dari database relasional, dalam rangka mencapai keuntungan yang diantisipasi dalam
fungsi sehubungan dengan database tertentu, benda-benda di
database harus diekspor sebagai objek kelas pertama ke Web, dan di sana-
kedepan perlu untuk dipetakan ke dalam sistem URI. Para menghubungkan bahwa di bawah-
SW pin yang tentu saja dimaksudkan untuk menyediakan infrastruktur generik
untuk konten web mesin-processable, tetapi telah berpendapat bahwa ini
infrastruktur juga membahas banyak kekhawatiran tradisional
hypermedia komunitas [278] .3.1. Web semantik 25
Melakukan fungsi ini memerlukan pergeseran mendasar dalam kita di bawah-
berdiri tentang bagaimana kita menggunakan URI. Biasanya, nama dan alamat-alamat
berbeda, nama sesuatu merujuk langsung ke sana, alamat yang mengatakan
Anda mana (jika tidak tepat bagaimana untuk mendapatkan itu). Dalam tradisional com-
pengidentifikasi menempatkan muncul dalam bahasa pemrograman, alamat adalah
lokasi di memori. Nama yang dipakukan ke obyek, alamat ke tempat-tempat,
dan karena itu obyek harus memiliki satu nama selamanya sementara alamatnya
bisa berubah sewenang-wenang sering. Hal ini dalam beberapa hal dimasukkan ke dalam “klasik”
melihat dari Web: ada asumsi bahwa identifier (URI)
akan menjadi salah satu dari dua macam hal. Itu baik akan menjadi nama
sesuatu, dipahami secara terpisah dari lokasi – sebuah URN – atau menentukan
lokasi hal – URL. Jadi kelas URI dipartisi
ke dalam kelas guci-guci dan kelas URL (dan mungkin satu atau dua
lain, seperti Uniform Resource Citations). Skema HTTP, untuk
misalnya, dilihat sebagai skema URL.
Lapisan ini tambahan komplikasi konseptual secara bertahap terlihat
bisa berguna kurang, dan gagasan tentang URI menjadi primer. URI bisa
melakukan yang mengidentifikasi baik secara langsung atau melalui lokasi, namun ini bukan
konseptual dalam perbedaan. Oleh karena HTTP adalah skema URI, meskipun
sebuah URI HTTP mengidentifikasi objek dengan mewakili akses primer
mekanisme, dan sebagainya (informal) kita bisa bicara tentang URI HTTP yang
URL. Nama / alamat Perbedaan adalah sebuah metafora spasial yang bekerja
dengan baik dalam lingkungan komputasi standar, tapi dalam jaringan
sistem komputasi perbedaan rusak. Demikian pula, objek dapat
diganti, dan sering adalah (alasan mengapa mereka tidak boleh dibahas
dalam Bagian 5.4.6 di bawah). Jika sistem hirarki penamaan sudah diatur dan
dikelola oleh otoritas, maka nama tersebut akan berfungsi hanya selama
sebagai otoritas yang mendukung bahwa sistem hirarkis, dan pada batas
hanya selama sebagai otoritas itu sendiri tetap ada.
Jadi kita harus berhati-hati dari menekan analogi spasial
nama / sistem alamat terlalu dekat. Lokasi literal adalah titik di
ruang 3-D, dan dalam sistem komputer jaringan kita tidak harus mendapatkan
juga tetap pada apa yang kita harus memanggil nama, atau alamat, atau fisik
lokasi sel memori yang akan menyimpannya. Seorang anggota komputer
Alamat ORY sering alamat dalam ruang memori virtual yang dialokasikan
suatu benda, yang diterjemahkan digunakan oleh perangkat keras ke dalam fisik
alamat memori. alamat IP yang tidak terikat pada komputer tertentu, 26 Rekayasa Web
namun secara implisit berisi referensi ke informasi routing, sehingga com-
puter sesuai dengan alamat IP yang diberikan tidak dapat dipindahkan jauh di
struktur routing. Nama domain bisa digunakan untuk merujuk ke komputer atau
apa komputer menyajikan ketika kita ingin berhak untuk memindahkan
hal yang berhubungan dengan identifikasi dari satu bagian dari Inter-
bersih yang lain. Jadi Domain Name System (DNS), karena kemerdekaan-
penyok dari sistem routing, tidak membatasi alamat IP yang
dapat diberikan ke komputer dari sebuah nama domain yang diberikan. DNS memang terlihat
seperti sistem nama, sedangkan alamat IP lakukan tampaknya berfungsi seperti
alamat [26].
Namun, juga sangat diamati bahwa domain nama untuk tertentu
sumber daya melakukan perubahan, karena protokol yang digunakan untuk penamaan mereka
diubah – alasan adalah bahwa ada informasi tertanam dalam
nama. Dalam dunia offline, nama bisa bertahan kegagalan tersebut embed-
informasi DED untuk tetap benar (John Stuart Mill memberikan contoh
‘Dartmouth’ sebagai tempat yang lokasinya mungkin atau tidak mungkin tetap di
muara Sungai Dart). Perubahan tersebut ada yang dipermasalahkan. Tapi online,
ini lebih sulit untuk memastikan.
Pertimbangkan contoh http://pegasus.cs.example.edu/disk1/
siswa / romeo / keren / terbaru / readthis.html [26]. Ada berbagai macam
alasan mengapa hal ini URI bisa berubah. ‘Pegasus’, ‘cs’, dll ‘mahasiswa’ mungkin
semua perubahan selama bertahun-tahun sebagai komputer yang berbeda terbiasa dengan tuan rumah informasi, atau sebagai lulusan Romeo dan menjadi anggota fakultas.
pendapat-Nya tentang apa yang ‘keren’ atau apa yang ‘terbaru’ juga akan berevolusi
dari waktu ke waktu (satu harapan). ‘Http’, yang merupakan protokol yang digunakan untuk mempresentasikan sumber daya, dan ‘readthis’ yang relatif bermakna adalah yang paling mungkin bagian dari URI yang terkait dengan sumber daya tertentu untuk berubah.
Alasan informasi tersebut disertakan adalah karena nama harus
dereferenced dalam rangka untuk mencari tahu apa pun tentang apa nama
adalah penamaan. Biasanya yang melibatkan menggunakan semacam index atau set
indeks, yang mungkin resmi dan kanonik, atau informal dan tidak resmi,
untuk mencari nama. indeks tersebut sering hirarkis untuk memfasilitasi
lookup, sebagai DNS namanya. Ini mungkin untuk menghilangkan semua informasi
dari nama domain, dan memastikan identifikasi unik untuk sumber daya
(Dan memang ada maka akan ada alasan yang jelas, segala sesuatu yang
sama, mengapa identifier tidak boleh permanen juga), pada biaya
membuat sulit untuk mencari dan dereference.3.1. Web semantik 27
hal-hal seperti itu yang penting relatif kecil sebagai manusia selama
adalah pengguna utama dan pemeras Web – setelah semua, satu terutama
setelah sumber daya dan konten yang mengandung, dan meskipun mungkin
frustasi untuk mengikuti URI hanya untuk menemukan sumber daya tidak lagi tinggal
sana, yang adalah iritasi daripada gangguan serius dalam sistem-
tem. Orang juga relatif fleksibel dalam temu online dan dapat toler-
makan ambiguitas. Tetapi beberapa jenis resolusi untuk nama / alamat masalah
diperlukan jika kita mengharapkan sistem formal untuk menangani dengan URI. SW ini
alat untuk melakukan hal-hal dalam ruang sosial, bukan hanya satu set aturan untuk
memanipulasi formula, jadi kita perlu tahu apa yang kita maksud, dan
bagaimana mendapatkan pada saat-referen mana yang sesuai. Hal ini diinginkan untuk e-
sistem perdagangan, misalnya, untuk merujuk tanpa ambiguitas ke suatu nomor hl: dokumen seperti tagihan dan faktur, barang-barang abstrak seperti
harga, dan hal-hal konkret seperti pembeli dan barang-barang yang sebenarnya dbeli dan dijual. merangkum [31] dan memberikan kritik dari num besar.

Translate Chapter 2

BAB 2

2.1 Web arsitektur

Arsitektur dari Web eksploitasi teknologi sederhana yang menghubungkan efisien, untuk mengaktifkan ruang informasi yang sangat fleksibel dan bermanfaat, dan yang paling penting, skala. Web telah menjadi sebuah platform yang mengesankan yang mana seperti ribuan bunga telah mekar, dan harapan itu dapat tumbuh lebih lanjut, meliputi bahasa lebih lanjut, media dan kegiatan lebih lanjut, hosting informasi lebih lanjut, serta menyediakan alat dan metode untuk menginterogasi data yang keluar.

Web adalah ruang di mana sumber daya yang diidentifikasi oleh Seragam Resource Identifier (URI - [33]). Ada protokol untuk mendukung interaksi antara agen, dan format untuk mewakili informasi sumber daya. Ini adalah bahan dasar dari Web. Pada desain mereka tergantung utilitas dan efisiensi interaksi Web, beberapa di antaranya merupakan bagian dari konsepsi asli, sementara yang lain harus belajar dari pengalaman.

Identifikasi sumber daya penting untuk dapat berbagi informasi tentang mereka, Sumber daya tersebut dapat berupa apa saja yang dapat dihubungkan atau dibicarakan, banyak sumber daya adalah murni informasi, tetapi yang lain tidak. Selanjutnya, tidak semua sumber daya yang di Web, bahwa mereka mungkin dapat diidentifikasi dari Web.

Untuk penalaran dan fungsi mengacu terjadi pada skala global, sistem identifikasi diperlukan untuk menyediakan satu global standar; URI menyediakan sistem itu. Akan mungkin bagi alternative sistem URI untuk dikembangkan, tetapi nilai tambah satu global sistem pengidentifikasi, memungkinkan menghubungkan, bookmark dan lainnya fungsi berbagai aplikasi heterogen, tinggi. Sumber Daya URI telah terkait dengan mereka, dan setiap URI idealnya mengidentifikasi satu sumber daya secara konteks-independen. Prinsip-prinsip

hubungan antara URI dan sumber daya yang diinginkan tetapi tidak tegas dilaksanakan, biaya gagal mengaitkan URI dengan sumber daya adalah ketidakmampuan untuk merujuk ke sana, sedangkan biaya penempatan dua sumber ke URI akan error, sebagai data tentang salah satu sumber daya akan diterapkan ke lainnya. URI juga menghubungkan Web dengan dunia sosial offline, di mereka mewajibkan lembaga. Mereka berada di bawah skema didefinisikan tertentu,

yang mungkin yang paling umum dipahami adalah HTTP, FTP dan mailto, skema tersebut terdaftar dengan internet Ditugaskan Nomor Authority Jadi jika kita ambil HTTP sebagai contoh, HTTP URI dimiliki dan menyalurkan oleh orang atau organisasi, dan dapat dialokasikan secara bertanggung jawab atau tidak bertanggung jawab. Sebagai contoh, sebuah URI HTTP harus mengacu ke sumber tunggal, dan dialokasikan untuk pemilik tunggal. Hal ini juga diinginkan

untuk suatu URI untuk merujuk kepada sumber daya yang permanen, dan tidak mengubah

referensi dari waktu ke waktu. Komunikasi melalui Web melibatkan pertukaran pesan yang dapat berisi data atau

metadata tentang sumber daya. Apakah mengakses sumber informasi memerlukan bervariasi dari konteks ke konteks, tapi mungkin pengalaman yang paling umum adalah menerima

representasi dari (keadaan) sumber daya pada browser. Tentu tidak perlu kasus yang dereferencing URI otomatis mengarah ke agen mendapatkan akses istimewa ke sumber daya. Ini mungkin bahwa tidak ada representasi dari sumber daya tersedia, atau bahwa akses ke sumber daya aman (misalnya kata sandi terkontrol), tetapi mungkin untuk merujuk

ke sumber daya menggunakan perusahaan URI tanpa memaparkan sumber daya yang untuk umum tampilan.

Pengembangan Web sebagai ruang, bukan yang besar dan papan pengumuman kompleks, mengikuti dari kemampuan agen untuk menggunakan interaksi untuk mengubah negara dari sumber daya, dan menanggung kewajiban dan tanggung jawab. Mengambil representasi adalah contoh dari apa yang disebut interaksi yang aman di mana perubahan tidak terjadi, sementara posting daftar adalah interaksi yang tidak aman di mana negara-negara sumber daya 'dapat diubah. Perhatikan bahwa sifat universal URI membantu identifikasi dan pelacakan

kewajiban yang timbul secara online melalui interaksi yang tidak aman.

Tidak semua URI dimaksudkan untuk memberikan akses ke representasi dari sumber daya yang mereka mengidentifikasi. Misalnya, mailto ini: skema mengidentifikasi sumber daya yang dicapai dengan menggunakan Internet mail (misalnya mailto: romeo@example.edu mengidentifikasi kotak surat tertentu), tetapi mereka sumber daya yang tidak dapat dipulihkan dari URI dalam cara yang sama seperti halaman web adalah. Sebaliknya, URI digunakan untuk surat langsung ke kotak surat tertentu, atau alternatif untuk menemukan mail dari itu.

2.2 Web ilmu : Metodologi

Jika penyelidikan dari web tidak menjadi perhitungan seperti ilmu Ilmiah, maka pertanyaan yang segera datang adalah bagaimana metode ilmiah harus mencoba domain tertentu. Bagaimana peneliti dan insinyur web untuk memahami tenteng hubungan masyarakat lebih luas, dan untuk berinovasi?

Berbagai aspek dari Web relatif baik dipahami, dan sebagai sebuah contoh rekayasa blok bangunan yang dibuat, bukan fenomena alam.Namun demikian, sebagai Web telah berkembang dalam kompleksitas dan jumlah dan jenis interaksi yang telah membengkak, itu tetap kasus yang kita tahu lebih banyak tentang beberapa fenomena alam yang kompleks (contoh jelas adalah genom manusia) daripada kita lakukanyang satu ini rekayasa tertentu.
Namun itu benar-benar berkembang, ada
ilmu Web perlu memenuhi beberapa kondisi yang jelas. Perlu menjadi falsifiabilty hipotesis dan pengulangan penyelidikan. akan perlu prinsip-prinsip independen dan standar untuk menilai ketika hipotesis telah dibentuk.

Ada masalah nyata tentang bagaimana prinsip-prinsip. Dan tentu sajaharus ada metode untuk bergerak dari penilaia Web dan yang evolusi untuk pengembangan dan pelaksanaan inovasi.

Ambil satu contoh, ada sejumlah teknologi dan metode
untuk pemetaan Web dan menandai keluar topologi nya. The visualisasi
seringkali sangat mengesankan, dengan interpretasi tiga-dimensi dan
warna-kode link antara node. Tapi bagaimana diverifikasi peta seperti itu? Dalam
indra apa yang mereka katakan kami 'bagaimana Web adalah'? Apa keterbatasan?
Aplikasi jelas, dalam hal metodologis, peta dan
grafik struktur Web adalah untuk langsung sampling, dengan menentukan
properti yang model dan sampel dari Web seharusnya.pertumbuhan Web membuat survei yang lengkap dari tahun-tahun pertanyaan
lalu, dan ilmuwan kebutuhan informasi statistik yang cepat dan tepat waktu tentang
isi sastra Web tersedia. Perwakilan sampling adalah kunci
untuk metode tersebut, tapi bagaimana seharusnya sebuah sampel dikumpulkan dalam rangka
secara tepat disebut wakil? Untuk menjadi benar bermanfaat, contoh
harus acak; 'keacakan' biasanya ditetapkan untuk domain tertentu, dan pada umumnya bahwa semua individu dalam domain memiliki
kemungkinan yang sama yang dipilih sebagai sampel. Tapi untuk Web
yang diperlukan, misalnya, memahami apa yang individu perlukan, karena
Misalnya, apakah kita peduli dengan website atau halaman Web? Jika mantan,
maka orang bisa membayangkan kesulitan karena tidak ada pencacahan lengkap
mereka. Dan metode sampling berdasarkan, mengatakan, alamat IP yang rumit
oleh penduduk tentu jarang dari ruang alamat[219].

Selanjutnya, begitu murah adalah operasi di Web bahwa num kecil ber dari operator bisa miring namun hati-hati hasil sampel adalah dipilih. Sebuah survei melaporkan secara lebih rinci di bawah ini [99] tampaknya dis- ditutupi bahwa 27% dari halaman dalam domain de. diubah setiap minggu, sebagai dibandingkan dengan 3% untuk Web secara keseluruhan. Penjelasan ternyata tidak menjadi kerajinan khas Jerman, melainkan di atas juta URL, sebagian tetapi tidak semua pada server Jerman, yang memutuskan untuk suatu satu alamat IP, yang secara otomatis dihasilkan dan terus berubah

situs pornografi.

Web memiliki banyak sifat yang tidak biasa yang membuat sampling rumit; bagaimana bisa rasa hormat metode sampling apa yang tampaknya papan nama prima significant14 Web dan Ilmu nya sifat seperti, misalnya, persentase halaman diperbarui setiap hari, mingguan, dll? Bagaimana kita bisa faktor dalam isu-isu seperti kemerdekaan mendasari sumber data? Apakah kita memiliki banyak pemahaman dari distribusi bahasa di seluruh Web (dan istilah dalam bahasa -. cf [167]), dan bagaimana meningkatkan kepandaian dalam memberikan mempengaruhi hal-hal [138]?

Dan bahkan jika kita senang dengan metodologi sampling kami, di tengah-tengah bagaimana semua suara bisa kita menemukan struktur menarik efisien [191]? Selanjutnya, meskipun untuk banyak tujuan Web dapat diobati sebagai ruang informasi statis, tentunya dinamis dan berkembang. Jadi segala upaya untuk memahami longitudinal Web akan membutuhkan untuk mengambil evolusi itu ke dalam account [218], dan model idealnya memiliki pertumbuhan sistem (dalam hal penambahan konstan baru titik dan sisi ke grafik), bersama-sama dengan struktur link yang tidak invarian dari waktu ke waktu, dan hubungan domain hirarkis yang selalu rentan terhadap revisi, dibangun ke dalam mereka (lih. misalnya [253]). Analytic pemodelan dikombinasikan dengan data empiris yang dikumpulkan dengan hati-hati dapat digunakan untuk menentukan probabilitas halaman Web yang sedang diedit (Mengubah konten informasi mereka) atau tidak dihapus. Satu percobaan pengawasan ratusan ribu halaman selama beberapa bulan Hasil menarik yang dihasilkan: setiap putaran satu waktu sekitar 20% dari web-halaman di bawah 11 hari tua, sedangkan 50% muncul di sebelumnya tiga bulan. Di sisi lain, 25% lebih dari berumur tahun – usia yang didefinisikan di sini sebagai perbedaan antara waktu modifikasi terakhir tion ke halaman dan waktu download [43]. Percobaan lain terlibat merayapi 150m halaman HTML sekali seminggu selama 11 minggu, dan menemukan, misalnya, kuat hubungan antara tingkat-top domain dan frekuensi perubahan (. halaman com diubah lebih fre- paling sering dari gov atau.. halaman edu), dan bahwa dokumen-dokumen besar (mungkin counterintuitively) diubah lebih sering dari yang kecil. Frekuensi perubahan terakhir adalah prediktor yang baik di masa depan

perubahan, hasil potensial penting bagi perayap Web incremental [99]. Perkembangan metode sampling feed Web yang sangat cepat ke dalam pengembangan pencarian lebih efisien dan akurat. Metode untuk menemukan informasi secara online, baik logis atau heuristik, apakah data-berpusat atau pada model sistem temu kembali informasi, memerlukan mapping.2.2 akurat. Web ilmu: Metodologi 15

Jadi salah satu aspek dari Web Ilmu adalah investigasi Web dalam untuk tempat ancaman, peluang dan invariants untuk pengembangannya. Lain adalah rekayasa yang baru, mungkin metode tak terduga berurusan dengan informasi, yang menciptakan ekstensi non-konservatif Web. teknik tersebut dapat berbasis penelitian, atau industri berbasis. Sintesis sistem baru, bahasa, algoritma dan alat-alat adalah kunci untuk pengembangan koheren dari Web, seperti, misalnya, dengan studi tentang sistem kognitif, dimana banyak kemajuan beberapa tahun terakhir tahun telah datang dengan teknik eksplorasi serta analisis dan deskripsi (lih. misalnya [51]). Jadi, misalnya, satu-satunya cara untuk menemukan dampak dari file sharing radikal desentralisasi adalah untuk mengembangkan peer to peer sistem dan operasi mereka amati pada skala semakin besar. Seperti upaya rekayasa perintis sangat penting untuk pengembangan Web, melainkan adalah setelah semua konstruksi. Hal ini penting untuk Web secara keseluruhan yang implementasi sistem berinteraksi dan tidak mengganggu, yang mana badan standar memainkan peranan penting.

Oleh karena itu Web Sains adalah kombinasi dari sintesis, analisis dan pemerintah-

kelola. Dalam sisa teks ini, kami akan mengambil tiga aspek pada gilirannya, dimulai dengan sintesis, maka analisis, dan kemudian isu-isu sosial yang berdampak pada pengembangan Web, sebelum berakhir dengan diskusi pemerintahan issues.3

Rekayasa Web

Pelacakan pengembangan Web, yang menentukan inovasi baik (misalnya P2P) dan yang buruk (phishing misalnya), dan memberikan kontribusi bagi perkembangan menguntungkan adalah kunci bertujuan Ilmu ofWeb. Pada bagian ini, kita akan meninjau beberapa petunjuk saat pembangun Web. Kami akan melihat Web Semantic dan beberapa isu dan kontroversi sekitarnya yang (Bagian 3.1), masalah berkaitan dengan referensi dan identitas

(Yang penting untuk Web Semantic untuk memastikan, tetapi juga untuk setiap

jenis analisis informasi berbuah – Bagian 3.2), dan kemudian pilihan inisiatif lebih lanjut, termasuk layanan Web, P2P, komputasi grid dan sebagainya (Bab 3.3).

3.1 Web semantik

Web adalah arsitektur berprinsip standar, bahasa dan formalisms yang menyediakan platform untuk aplikasi heterogen banyak subpopulasi. Hasilnya bisa mudah menjadi kusut, dan keputusan yang dibuat tentang standar yang mengatur satu formalisme dapat memiliki konsekuensi di luar, yang dapat timbal tentu saja untuk keputusan desain yang kompleks (cf. [146]). Memang, beberapa tuntutan di Web membuat godaan untuk model yang

163,1. Web semantik 17 semantik dengan formalisms sangat ekspresif, namun expressivity seperti perdagangan umum off melawan kegunaan dan satu set kecil baik dipahami prinsip-prinsip.

Namun, sering terjadi bahwa trade-off antara expressivity dan kegunaan adalah akibat dari penyalahgunaan umum dari formalisms tersebut. Untuk contoh – kita akan membahas contoh ini secara lebih rinci di bawah ini – menggunakan dari mesin, diimplementasikan dan diusulkan, dari Web Semantic [35, 17] untuk memperpanjang Web merupakan tujuan umum. Tapi desain SW dan terkait formalisms dan alat-alat dimaksudkan untuk memperpanjang Web untuk menutupi data terkait, tidak, seperti yang sering diasumsikan, untuk meningkatkan pencarian atau mendapatkan kekuatan yang lebih besar dari teks beranotasi (yang lain, terpisah, jenis ekstensi dari Web).


Translate Chapter 1

BAB 1

PENGATAR

World Wide Web adalah suatu teknologi yang baru berusia beberapa tahun, namun
pertumbuhannya, dan dampaknya terhadap masyarakat sangat menakjubkan. Awal nya adalah untuk mendukung informasi persyaratan penelitian fisik energi tinggi.
Hal ini telah menyebar ke dalam disiplin ilmu lain, akademisi pada umumnya, perdagangan, hiburan, politik, dan hampir di mana saja. Hal ini bebas dari kendala pencetakan dan fisik distribusi, hasil penelitian ilmiah, dan data pada saat mana penelitian yang dilakukan, bisa dibagi dengan cepat.
Menghubungkan,dan memungkinkan pekerjaan berada dalam konteks yang kayadan luas. Sementara itu, inovasi telah memperluas kemungkinan untuk berkomunikasi. Weblogs
dan wiki memungkinkan kedekatan percakapan, sedangkan potensi
multimedia dan interaktivitas sangat luas. Tapi baik Web maupun dunia yang keduanya bersifat statis. Web berkembang untuk menanggapi berbagai dorongan dari ilmu pengetahuan, perdagangan, masyarakat dan politik. Sebagai contoh, pertumbuhan e-science telah menciptakan suatu kebutuhan untuk mengintegrasikan sebagian besar jumlah data yang beragam dan heterogen; e-government dan e-commerce juga menuntut lebih efektif menggunakan informasi.

Kita perlu memahami kekuatan-kekuatan evolusi dan perkembanganTanpa seperti peluang apresiasi untuk menambahkan nilai pada web dengan memfasilitasi kemungkinan lebih komunikatif dan representasi mungkin akan terjawab. Tapi pembangunan bukan seluruh dari cerita. Meskipun multi-faceted dan extensible, Web didasarkan pada seperangkat prinsip-prinsip arsitektur yang perlu dihormati. Selanjutnya, Web adalah teknologi sosial yang berkembang pada pertumbuhan dan oleh karena itu perlu dipercaya dengan memperluas basis pengguna ,jaminan mutu, self control atas informasi, dan menghormati hak-hak dan preferensi lain semua aspek penting dari Web.
Aspek ini juga harus dipahami dan dipelihara sebagai perubahan Web. Agenda penelitian yang dapat membantu mengidentifikasi apa yang perlu di pertahankan dan di mana perubahan bisa menguntungkan adalah keharusan. Ini adalah tujuan dari Ilmu web, yang bertujuan untuk memetakan bagaimana desentralisasi informasi struktur dapat melayani secara ilmiah ilmiah, representasi dan komunikasi persyaratan, dan untuk menghasilkan desain dan prinsip desain yang mengatur struktur seperti [34]. Kami berpendapat bahwa ini ilmu desentralisasi struktur informasi adalah penting untuk memahami bagaimana informal
dan informasi link yang tidak direncanakan antara manusia, agen, database, organisasi dan aktor-aktor lain dan sumber daya dapat memenuhi informasi kebutuhan driver yang penting seperti e-science dan e-government.

Bagaimana sistem dasarnya desentralisasi dapat memiliki performa seperti
dirancang ke dalamnya adalah pertanyaan kunci dari Web Ilmu [34].:
Web Ilmu' adalah ungkapan ambigu. Ilmu Fisik
adalah disiplin analitik yang bertujuan untuk menemukan hukum yang menghasilkan atau menjelaskan fenomena yang diamati, ilmu komputer adalah sebagian besar (walaupun tidak
eksklusif) sintetis, dalam formalisms dan algoritma diciptakan dalam rangka mendukung perilaku yang diinginkan tertentu.
Ilmu web harus merupakan penggabungan dari kedua paradigma, Web perlu dipelajari dan
dipahami, dan perlu direkayasa. Pada skala mikro, Web adalah infrastruktur bahasa buatan dan protokol, yang merupakan bagian dari rekayasa. Tapi filosofi menghubungkan yang mengatur Web, dan yang digunakan dalam komunikasi, mengakibatkan sifat muncul pada skala makro (Beberapa yang diinginkan, dan karenanya harus direkayasa dalam, yang lain
tidak diinginkan, dan jika mungkin untuk direkayasa keluar). Dan tentu saja Penggunaan Web dalam komunikasi adalah bagian dari sistem yang lebih luas interaksi manusia diatur oleh konvensi dan hukum. Berbagai tingkat di whichWeb teknologi berinteraksi dengan masyarakat manusia berarti bahwa interdisciplinarity adalah kebutuhan perusahaan Web Science.
Seperti agenda interdisipliner penelitian, mampu mendorong pembangunan Web sosial dan ilmiah dalam cara yang berguna, belum terlihat dan perlu diciptakan. Untuk itu, pada bulan September 2005, sebuah Workshop Ilmu Web diselenggarakan di London, Inggris (rincian kontributorke Workshop diberikan dalam Ucapan Terima Kasih).
Lokakarya memeriksa sejumlah isu, termasuk:
• Muncul tren di Web.
• Tantangan untuk memahami dan membimbing pengembangan
Web.
• Menyusun penelitian untuk mendukung eksploitasi peluang
dibuat oleh (antara lain) mana-mana, mobilitas, media baru
dan peningkatan jumlah data yang tersedia secara online.
• Memastikan sifat sosial yang penting seperti privasi
dihormati.
• Mengidentifikasi dan melestarikan invariants penting dari theWeb
pengalaman.

Teks ini tumbuh dari Lokakarya Web science, dan ia mencoba untuk meringkas, memperluas dan mengomentari perdebatan. Bahwa interdisipliner diperlukan pendekatan disepakati oleh semua, mencakup komputer ilmu pengetahuan dan teknik, ilmu-ilmu fisika dan matematika, sosial ilmu pengetahuan dan kebijakan. Ilmu web, oleh karena itu, tidak hanya tentang metode untuk memodelkan, menganalisis dan memahami Web pada
mikro-dan makroskopik berbagai tingkatan. Hal ini juga tentang teknik protokol dan menyediakan infrastruktur, dan memastikan bahwa ada sesuai antara infrastruktur dan masyarakat yang host itu.
Ilmu web harus berkoordinasi rekayasa dengan agenda sosial, kebijakan dengan teknis
kendala dan kemungkinan, analisis dengan sintesis - itu inheren lintas disiplin, dan teks ini disusun untuk mencerminkan itu. Mengembangkan theWeb juga melibatkan menentukan apa faktor yang mempengaruh pengalaman Web, dan memastikan bahwa mereka tetap di tempat.
Contoh
keputusan arsitektur dasar yang mendukung meliputi Web: 404
kesalahan, yang berarti bahwa kegagalan untuk link ke sumber daya tidak menimbulkan bencana kegagalan; penggunaan Uniform Resource Indicator (URI).
Pendahuluan 5
eksploitasi penuh dari infrastruktur Internet yang sudah ada (seperti Domain Name System) sebagai platform yang theWeb dibangun. Standar juga penting, dan World Wide Web Consortium's (W3C) bekerja untuk menciptakan dan merekomendasikan standar tetap menjaga konsensus stakeholder menunjukkan bahwa rekayasa perlu pergi tangan di
tangan dengan proses negosiasi sosial.

Bagian 2 adalah tinjauan prinsip-prinsip ilmiah dan arsitektur dasar lebih terinci. Menjelajahi metafora dari 'evolusi' dapat membantu kita untuk menggambarkan Web sebagai ekologi populasi, dan sebagai masyarakat dengan persyaratan sosial biasa, kebijakan,dan aturan. Menghubungkan relevan pendekatan, yang meliputi metodologi varian, bervariasi spatiotemporal ukuran butir dan pemodelan di berbagai domain, akan menantang.

Bagian 3 membahas beberapa isu yang harus dilakukan dengan rekayasa Web, dan bagaimana mempromosikan, dan dipromosikan oleh, teknologi baru seperti sebagai grid atau jasa. Mungkin salah satu potensi perkembangan yang paling penting yang akan dibahas dalam bagian ini adalah SemanticWeb. Web biasanya ditandai sebagai jaringan banyak dokumen terkait yang dirancang untuk dibaca oleh manusia, sehingga mesin-pembacaan membutuhkan heuristik pengolahan bahasa alami. Namun, Semantic
Web, merupakan visi untuk memperluas dan menambahkan nilai ke Web, dimaksudkan untuk mengeksploitasi kemungkinan pernyataan logis atas data relasional terkait untuk memungkinkan otomatisasi pengolahan informasi yang banyak. Penelitian dan pembangunan telah berlangsung selama beberapa waktu sekarang pada pengembangan
bahasa dan formalisms yang akan mendukung query, inferensi, menyelaraskan model data, visualisasi dan pemodelan.

Untuk berkembang, Web Semantic kebutuhan filosofi desentralisasi yang sama sebagai World Wide Web. Salah satu tantangan adalah untuk memastikan bahwa berbagai
data individu sistem dapat digabung dengan konsistensi lokal tanpa mencoba tugas yang tidak mungkin untuk menegakkan konsistensi global. Selain itu, penggunaan dasar seperangkat simbol -URI - oleh sejumlah formalisms dengan sifat yang kontras, seperti
aturan dan logika, tanpa mengasumsikan apapun formalisme terpusat atau 'dasar' untuk menggambarkan Web juga non-sepele. Masalah ketiga adalah untuk melakukan dengan membawa data bersama-sama untuk memanfaatkan kekuatan amalgamasi dan kebetulan kembali; paling data yang saat ini duduk di repositori mandiri