twitter
    Find out what I'm doing, Follow Me :)

Translate Chapter 2

BAB 2

2.1 Web arsitektur

Arsitektur dari Web eksploitasi teknologi sederhana yang menghubungkan efisien, untuk mengaktifkan ruang informasi yang sangat fleksibel dan bermanfaat, dan yang paling penting, skala. Web telah menjadi sebuah platform yang mengesankan yang mana seperti ribuan bunga telah mekar, dan harapan itu dapat tumbuh lebih lanjut, meliputi bahasa lebih lanjut, media dan kegiatan lebih lanjut, hosting informasi lebih lanjut, serta menyediakan alat dan metode untuk menginterogasi data yang keluar.

Web adalah ruang di mana sumber daya yang diidentifikasi oleh Seragam Resource Identifier (URI - [33]). Ada protokol untuk mendukung interaksi antara agen, dan format untuk mewakili informasi sumber daya. Ini adalah bahan dasar dari Web. Pada desain mereka tergantung utilitas dan efisiensi interaksi Web, beberapa di antaranya merupakan bagian dari konsepsi asli, sementara yang lain harus belajar dari pengalaman.

Identifikasi sumber daya penting untuk dapat berbagi informasi tentang mereka, Sumber daya tersebut dapat berupa apa saja yang dapat dihubungkan atau dibicarakan, banyak sumber daya adalah murni informasi, tetapi yang lain tidak. Selanjutnya, tidak semua sumber daya yang di Web, bahwa mereka mungkin dapat diidentifikasi dari Web.

Untuk penalaran dan fungsi mengacu terjadi pada skala global, sistem identifikasi diperlukan untuk menyediakan satu global standar; URI menyediakan sistem itu. Akan mungkin bagi alternative sistem URI untuk dikembangkan, tetapi nilai tambah satu global sistem pengidentifikasi, memungkinkan menghubungkan, bookmark dan lainnya fungsi berbagai aplikasi heterogen, tinggi. Sumber Daya URI telah terkait dengan mereka, dan setiap URI idealnya mengidentifikasi satu sumber daya secara konteks-independen. Prinsip-prinsip

hubungan antara URI dan sumber daya yang diinginkan tetapi tidak tegas dilaksanakan, biaya gagal mengaitkan URI dengan sumber daya adalah ketidakmampuan untuk merujuk ke sana, sedangkan biaya penempatan dua sumber ke URI akan error, sebagai data tentang salah satu sumber daya akan diterapkan ke lainnya. URI juga menghubungkan Web dengan dunia sosial offline, di mereka mewajibkan lembaga. Mereka berada di bawah skema didefinisikan tertentu,

yang mungkin yang paling umum dipahami adalah HTTP, FTP dan mailto, skema tersebut terdaftar dengan internet Ditugaskan Nomor Authority Jadi jika kita ambil HTTP sebagai contoh, HTTP URI dimiliki dan menyalurkan oleh orang atau organisasi, dan dapat dialokasikan secara bertanggung jawab atau tidak bertanggung jawab. Sebagai contoh, sebuah URI HTTP harus mengacu ke sumber tunggal, dan dialokasikan untuk pemilik tunggal. Hal ini juga diinginkan

untuk suatu URI untuk merujuk kepada sumber daya yang permanen, dan tidak mengubah

referensi dari waktu ke waktu. Komunikasi melalui Web melibatkan pertukaran pesan yang dapat berisi data atau

metadata tentang sumber daya. Apakah mengakses sumber informasi memerlukan bervariasi dari konteks ke konteks, tapi mungkin pengalaman yang paling umum adalah menerima

representasi dari (keadaan) sumber daya pada browser. Tentu tidak perlu kasus yang dereferencing URI otomatis mengarah ke agen mendapatkan akses istimewa ke sumber daya. Ini mungkin bahwa tidak ada representasi dari sumber daya tersedia, atau bahwa akses ke sumber daya aman (misalnya kata sandi terkontrol), tetapi mungkin untuk merujuk

ke sumber daya menggunakan perusahaan URI tanpa memaparkan sumber daya yang untuk umum tampilan.

Pengembangan Web sebagai ruang, bukan yang besar dan papan pengumuman kompleks, mengikuti dari kemampuan agen untuk menggunakan interaksi untuk mengubah negara dari sumber daya, dan menanggung kewajiban dan tanggung jawab. Mengambil representasi adalah contoh dari apa yang disebut interaksi yang aman di mana perubahan tidak terjadi, sementara posting daftar adalah interaksi yang tidak aman di mana negara-negara sumber daya 'dapat diubah. Perhatikan bahwa sifat universal URI membantu identifikasi dan pelacakan

kewajiban yang timbul secara online melalui interaksi yang tidak aman.

Tidak semua URI dimaksudkan untuk memberikan akses ke representasi dari sumber daya yang mereka mengidentifikasi. Misalnya, mailto ini: skema mengidentifikasi sumber daya yang dicapai dengan menggunakan Internet mail (misalnya mailto: romeo@example.edu mengidentifikasi kotak surat tertentu), tetapi mereka sumber daya yang tidak dapat dipulihkan dari URI dalam cara yang sama seperti halaman web adalah. Sebaliknya, URI digunakan untuk surat langsung ke kotak surat tertentu, atau alternatif untuk menemukan mail dari itu.

2.2 Web ilmu : Metodologi

Jika penyelidikan dari web tidak menjadi perhitungan seperti ilmu Ilmiah, maka pertanyaan yang segera datang adalah bagaimana metode ilmiah harus mencoba domain tertentu. Bagaimana peneliti dan insinyur web untuk memahami tenteng hubungan masyarakat lebih luas, dan untuk berinovasi?

Berbagai aspek dari Web relatif baik dipahami, dan sebagai sebuah contoh rekayasa blok bangunan yang dibuat, bukan fenomena alam.Namun demikian, sebagai Web telah berkembang dalam kompleksitas dan jumlah dan jenis interaksi yang telah membengkak, itu tetap kasus yang kita tahu lebih banyak tentang beberapa fenomena alam yang kompleks (contoh jelas adalah genom manusia) daripada kita lakukanyang satu ini rekayasa tertentu.
Namun itu benar-benar berkembang, ada
ilmu Web perlu memenuhi beberapa kondisi yang jelas. Perlu menjadi falsifiabilty hipotesis dan pengulangan penyelidikan. akan perlu prinsip-prinsip independen dan standar untuk menilai ketika hipotesis telah dibentuk.

Ada masalah nyata tentang bagaimana prinsip-prinsip. Dan tentu sajaharus ada metode untuk bergerak dari penilaia Web dan yang evolusi untuk pengembangan dan pelaksanaan inovasi.

Ambil satu contoh, ada sejumlah teknologi dan metode
untuk pemetaan Web dan menandai keluar topologi nya. The visualisasi
seringkali sangat mengesankan, dengan interpretasi tiga-dimensi dan
warna-kode link antara node. Tapi bagaimana diverifikasi peta seperti itu? Dalam
indra apa yang mereka katakan kami 'bagaimana Web adalah'? Apa keterbatasan?
Aplikasi jelas, dalam hal metodologis, peta dan
grafik struktur Web adalah untuk langsung sampling, dengan menentukan
properti yang model dan sampel dari Web seharusnya.pertumbuhan Web membuat survei yang lengkap dari tahun-tahun pertanyaan
lalu, dan ilmuwan kebutuhan informasi statistik yang cepat dan tepat waktu tentang
isi sastra Web tersedia. Perwakilan sampling adalah kunci
untuk metode tersebut, tapi bagaimana seharusnya sebuah sampel dikumpulkan dalam rangka
secara tepat disebut wakil? Untuk menjadi benar bermanfaat, contoh
harus acak; 'keacakan' biasanya ditetapkan untuk domain tertentu, dan pada umumnya bahwa semua individu dalam domain memiliki
kemungkinan yang sama yang dipilih sebagai sampel. Tapi untuk Web
yang diperlukan, misalnya, memahami apa yang individu perlukan, karena
Misalnya, apakah kita peduli dengan website atau halaman Web? Jika mantan,
maka orang bisa membayangkan kesulitan karena tidak ada pencacahan lengkap
mereka. Dan metode sampling berdasarkan, mengatakan, alamat IP yang rumit
oleh penduduk tentu jarang dari ruang alamat[219].

Selanjutnya, begitu murah adalah operasi di Web bahwa num kecil ber dari operator bisa miring namun hati-hati hasil sampel adalah dipilih. Sebuah survei melaporkan secara lebih rinci di bawah ini [99] tampaknya dis- ditutupi bahwa 27% dari halaman dalam domain de. diubah setiap minggu, sebagai dibandingkan dengan 3% untuk Web secara keseluruhan. Penjelasan ternyata tidak menjadi kerajinan khas Jerman, melainkan di atas juta URL, sebagian tetapi tidak semua pada server Jerman, yang memutuskan untuk suatu satu alamat IP, yang secara otomatis dihasilkan dan terus berubah

situs pornografi.

Web memiliki banyak sifat yang tidak biasa yang membuat sampling rumit; bagaimana bisa rasa hormat metode sampling apa yang tampaknya papan nama prima significant14 Web dan Ilmu nya sifat seperti, misalnya, persentase halaman diperbarui setiap hari, mingguan, dll? Bagaimana kita bisa faktor dalam isu-isu seperti kemerdekaan mendasari sumber data? Apakah kita memiliki banyak pemahaman dari distribusi bahasa di seluruh Web (dan istilah dalam bahasa -. cf [167]), dan bagaimana meningkatkan kepandaian dalam memberikan mempengaruhi hal-hal [138]?

Dan bahkan jika kita senang dengan metodologi sampling kami, di tengah-tengah bagaimana semua suara bisa kita menemukan struktur menarik efisien [191]? Selanjutnya, meskipun untuk banyak tujuan Web dapat diobati sebagai ruang informasi statis, tentunya dinamis dan berkembang. Jadi segala upaya untuk memahami longitudinal Web akan membutuhkan untuk mengambil evolusi itu ke dalam account [218], dan model idealnya memiliki pertumbuhan sistem (dalam hal penambahan konstan baru titik dan sisi ke grafik), bersama-sama dengan struktur link yang tidak invarian dari waktu ke waktu, dan hubungan domain hirarkis yang selalu rentan terhadap revisi, dibangun ke dalam mereka (lih. misalnya [253]). Analytic pemodelan dikombinasikan dengan data empiris yang dikumpulkan dengan hati-hati dapat digunakan untuk menentukan probabilitas halaman Web yang sedang diedit (Mengubah konten informasi mereka) atau tidak dihapus. Satu percobaan pengawasan ratusan ribu halaman selama beberapa bulan Hasil menarik yang dihasilkan: setiap putaran satu waktu sekitar 20% dari web-halaman di bawah 11 hari tua, sedangkan 50% muncul di sebelumnya tiga bulan. Di sisi lain, 25% lebih dari berumur tahun – usia yang didefinisikan di sini sebagai perbedaan antara waktu modifikasi terakhir tion ke halaman dan waktu download [43]. Percobaan lain terlibat merayapi 150m halaman HTML sekali seminggu selama 11 minggu, dan menemukan, misalnya, kuat hubungan antara tingkat-top domain dan frekuensi perubahan (. halaman com diubah lebih fre- paling sering dari gov atau.. halaman edu), dan bahwa dokumen-dokumen besar (mungkin counterintuitively) diubah lebih sering dari yang kecil. Frekuensi perubahan terakhir adalah prediktor yang baik di masa depan

perubahan, hasil potensial penting bagi perayap Web incremental [99]. Perkembangan metode sampling feed Web yang sangat cepat ke dalam pengembangan pencarian lebih efisien dan akurat. Metode untuk menemukan informasi secara online, baik logis atau heuristik, apakah data-berpusat atau pada model sistem temu kembali informasi, memerlukan mapping.2.2 akurat. Web ilmu: Metodologi 15

Jadi salah satu aspek dari Web Ilmu adalah investigasi Web dalam untuk tempat ancaman, peluang dan invariants untuk pengembangannya. Lain adalah rekayasa yang baru, mungkin metode tak terduga berurusan dengan informasi, yang menciptakan ekstensi non-konservatif Web. teknik tersebut dapat berbasis penelitian, atau industri berbasis. Sintesis sistem baru, bahasa, algoritma dan alat-alat adalah kunci untuk pengembangan koheren dari Web, seperti, misalnya, dengan studi tentang sistem kognitif, dimana banyak kemajuan beberapa tahun terakhir tahun telah datang dengan teknik eksplorasi serta analisis dan deskripsi (lih. misalnya [51]). Jadi, misalnya, satu-satunya cara untuk menemukan dampak dari file sharing radikal desentralisasi adalah untuk mengembangkan peer to peer sistem dan operasi mereka amati pada skala semakin besar. Seperti upaya rekayasa perintis sangat penting untuk pengembangan Web, melainkan adalah setelah semua konstruksi. Hal ini penting untuk Web secara keseluruhan yang implementasi sistem berinteraksi dan tidak mengganggu, yang mana badan standar memainkan peranan penting.

Oleh karena itu Web Sains adalah kombinasi dari sintesis, analisis dan pemerintah-

kelola. Dalam sisa teks ini, kami akan mengambil tiga aspek pada gilirannya, dimulai dengan sintesis, maka analisis, dan kemudian isu-isu sosial yang berdampak pada pengembangan Web, sebelum berakhir dengan diskusi pemerintahan issues.3

Rekayasa Web

Pelacakan pengembangan Web, yang menentukan inovasi baik (misalnya P2P) dan yang buruk (phishing misalnya), dan memberikan kontribusi bagi perkembangan menguntungkan adalah kunci bertujuan Ilmu ofWeb. Pada bagian ini, kita akan meninjau beberapa petunjuk saat pembangun Web. Kami akan melihat Web Semantic dan beberapa isu dan kontroversi sekitarnya yang (Bagian 3.1), masalah berkaitan dengan referensi dan identitas

(Yang penting untuk Web Semantic untuk memastikan, tetapi juga untuk setiap

jenis analisis informasi berbuah – Bagian 3.2), dan kemudian pilihan inisiatif lebih lanjut, termasuk layanan Web, P2P, komputasi grid dan sebagainya (Bab 3.3).

3.1 Web semantik

Web adalah arsitektur berprinsip standar, bahasa dan formalisms yang menyediakan platform untuk aplikasi heterogen banyak subpopulasi. Hasilnya bisa mudah menjadi kusut, dan keputusan yang dibuat tentang standar yang mengatur satu formalisme dapat memiliki konsekuensi di luar, yang dapat timbal tentu saja untuk keputusan desain yang kompleks (cf. [146]). Memang, beberapa tuntutan di Web membuat godaan untuk model yang

163,1. Web semantik 17 semantik dengan formalisms sangat ekspresif, namun expressivity seperti perdagangan umum off melawan kegunaan dan satu set kecil baik dipahami prinsip-prinsip.

Namun, sering terjadi bahwa trade-off antara expressivity dan kegunaan adalah akibat dari penyalahgunaan umum dari formalisms tersebut. Untuk contoh – kita akan membahas contoh ini secara lebih rinci di bawah ini – menggunakan dari mesin, diimplementasikan dan diusulkan, dari Web Semantic [35, 17] untuk memperpanjang Web merupakan tujuan umum. Tapi desain SW dan terkait formalisms dan alat-alat dimaksudkan untuk memperpanjang Web untuk menutupi data terkait, tidak, seperti yang sering diasumsikan, untuk meningkatkan pencarian atau mendapatkan kekuatan yang lebih besar dari teks beranotasi (yang lain, terpisah, jenis ekstensi dari Web).


0 komentar:

Posting Komentar