Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






HTML - редактори і універсальні редактори Web - сторінок. Опис мови HTML. Теги мови HTML та їх властивості.






HTML - це мова гіпертекстової розмітки, що використовується для кодуваннядокументів. Мова HTML являє собою набір команд, відповідно до яких браузер відображає вміст документа, команди HTML не відображаються. У мові HTML реалізований механізм гіпертекстових посилань, який забезпечує зв'язок одного документа з іншими. Ці документи можуть знаходитися на тому ж сервері, що і сторінка, з якою на них робиться посилання, а можуть бути розміщені на іншому сервері.

Ідея HTML - приклад надзвичайно вдалого рішення проблеми побудови гіпертекстової системи за допомогою спеціального засобу керування відображенням.

Найбільш ефективною формою організації гіпертексту були визнані контекстні гіпертекстові посилання, а крім того, було визнано розподіл на посилання, асоційовані з усім документом у цілому і з окремими його частинами.

Всі документи HTML мають одну і ту ж структуру, яка визначається фіксованим набором тегів структури. Документ HTML завжди повинен починатися з тега < HTML> і закінчуватисявідповідним закриває тегом (< / HTML>). Усередині документа виділяються два основні розділи: розділ заголовків і тіло документа, - йдуть саме в такому порядку. Розділ заголовків містить інформацію, що описує документ у цілому, і обмежується тегами < НЕАD> та < / НЕАD>.Зокрема, розділ заголовків повинен містити загальний заголовок документа, обмежений парним тегом < ТITLE>.

Основний зміст розмішається в тілі документа, який обмежується парним тегом < ВОDY>.Строго кажучи, положення структурних тегів у документі неважко визначити, навіть якщо й вони опущені. Тому стандарт мови HTML вимагає лише наявності тега < TITLE> (і, відповідно,

< / ТITLE>). Тим не менш, при створенні документа HTML опускати структурні теги не рекомендується. Найпростіший правильний документ HTML містить всі теги, що визначають структуру, може виглядати наступним чином:

< HTML>

< HEAD> < TITLE> Тема документа < / TITLE> < / HE А D>

< BODY>

Текст документа

< / BODY>

< / HTML>

Елементи HTML.

Для парних тегів область впливу визначається частиною документа між відкриває і закриває тегом. Таку частина документа розглядають як елемент мови HTML. Так, можна говорити про «елементі BODY», що включає тег < / BODY>, основний зміст документа та закриває тег < / BODY>. Весь документ HTML. можна розглядати як «елемент HTML.». Для непарних тегів елемент збігається з тегом, який його визначає.

Більшість елементів мови HTML. описує частини змісту документа і міститься між тегами < BODY>. і < / BODY>, тобто всередину структурного елементу BODY. Такі елементи ділять на блокові і текстові. Блокові елементи відносяться до частин тексту рівня абзацу. Текстові елементи описують властивості окремих фраз і ще болів дрібних частин тексту.

Тепер можна сформулювати правила вкладення елементів.

Елементи не повинні перетинатися. Іншими словами, якщо відкриває тег розташовується всередині елемента, то і відповідний закриваючий тег повинен розташовуватися усередині цього ж елемента.

Блокові елементи можуть містити вкладені блокові і текстові елементи.

Текстові елементи можуть містити вкладені текстові елементи.

Текстові елементи не можуть містити вкладені блокові елементи.

Функціональні блокові елементи.

У більшості документів основними функціональними елементами є заголовки і абзаци.Мова HTML. підтримує шість рівнів заголовків. Вони задаються за допомогою парних тегів від < Н1> до < Н6>. При відображенні Web-документи ються за допомогою таким чином; тегом (документа на екрані комп'ютера ці елементи показуються за допомогою шрифтів різного розміру.

Звичайні абзаци задаються за допомогою парного тега < р>. Мова HTML. не містить засобів для створення абзацного відступу («червоного рядка»), тому при відображенні на екрані комп'ютера абзаци розділяються порожнім рядком. Закриваючий тег < / Р> розглядається як необов'язковий. Мається на увазі, що він стоїть перед тегом, який задає початок чергового абзацу документа. Наприклад:

< H1> Тема < / H1>

< Р> Перший абзац < Р> Другий абзац

< H2> Заголовок другого рівня < / Н2>

Наслідком наявності спеціального тега, що визначає абзац, є той факт, що звичайногосимволу кінця рядка, що вводиться після натискання клавіші ENTER, для створення абзацного відступу недостатньо. Мова HTML. розглядає символи кінця рядки та прогалини особливим чином. Будь-яка послідовність; складається тільки з пропусків і символів кінця рядка, при відображенні документа розглядається як одиночний пробіл. Це, зокрема, означає, що символкінця рядка навіть не здійснює переходу на новий рядок (для цієї мети використовується текстовий елемент, що задається непарним тегом < BR>.

В якості обмежувача абзаців може також використовуватися горизонтальна лінійка. Цей елемент задається непарним тегом < HR>. При відображенні документа на екрані лінійка розділяє частини тексту один від одного. Її довжина й товщина задається атрибутами тега < HR>.

< HR ALIGN= " RIGHT" SIZE= " 10" WIDTH= " 50%" >

Цей тег створює горизонтальну лінійку шириною в 10 пікселів, що займає половину ширини вікна і розташовану праворуч.

 

Бернерс-Лі розробив універсальний ідентифікатор документа (Universal Document Identifier - UDI), пізніше перетворився у всьому уже відомий універсальний покажчик ресурсу (Universal Resource Locator - URL). Влітку 1991 року був запущений перший web-сервер.

URI відомий під багатьма іменами: WWW адреса, універсальний ідентифікатор документа (Universal Document Identifiers), універсальний ідентифікатор ресурсу (Universal Resource Identifiers), і, нарешті, універсальний локатор ресурсу URL (Uniform Resource Locators; тотожність URI і URL сумнівно, так як URL є окремим випадком URI (примітка перекладача)) і універсальне ім'я ресурсу (URN). Що стосується HTTP, універсальний ідентифікатор ресурсу являє собою форматований рядок символів, яка ідентифікує ім'я, положення або якісь ще характеристики ресурсу.

URI - це символьний рядок, що дозволяє ідентифікувати який-небудь ресурс: документ, зображення, файл, службу, скриньку електронної пошти і т. Д. Перш за все, мова йде, звичайно, про ресурси мережі Інтернет та Всесвітньої павутини. URI надає простий і розширюваний спосіб ідентифікації ресурсів. Розширюваність URI означає, що вже існують кілька схем ідентифікації всередині URI, і ще більше буде створено в майбутньому.

URI (Uniform Resource Identifier, Універсальний ідентифікатор ресурсу) (RFC 2396, August 1998) - компактна рядок символів для ідентифікації абстракного або фізичної ресурсу. Під ресурсом розуміється будь-який об'єкт, що належить деякому простору. Включає і перевизначає визначені раніше URL (RFC 1738 / RFC 1808) і URN (RFC 2141, RFC 2611).

URI призначений для унікальної ідентифікації будь-якого ресурсу.Деякі підмножини URI:

URL (Uniform Resource Locator, Універсальний покажчик ресурсу), - підмножина схем URI, який ідентифікує ресурс за способом доступу до нього (наприклад, його " місцезнаходженням в мережі") замість того, щоб ідентифікувати його за назвою або інших атрибутів цього ресурсу.

Приклади URL:

https://www.ipm.kstu.ru/index.php

ftp: //www.ipm.kstu.ru/

В HTML записується так:

< a href=" https://www.ipm.kstu.ru/index.php" > < /a>

URN (Uniform Resource Name, Універсальне ім'я ресурсу) - приватна URI-схема " urn: " з підмножиною " простору імен", який повинен бути унікальним і незмінним навіть у тому випадку, коли ресурс вже не існує або недоступний.

Передбачається що, наприклад браузер, знає, де шукати цей ресурс.

синтаксис:

urn: namespace: data1.data2, more-data, де namespace (простір імен) визначає, яким чином використовуються дані, зазначені після другого ": ".

Приклад URN:

urn: ISBN: 0-395-36341-6

ISBN - тематичний класифікатор для видавництв0-395-36341-6 – конкретний номер книги чи журналу

При отриманні URN клієнтська програма звертається до ISBN (каталогу " тематичний класифікатор для видавництв" в Інтернеті). І отримує розшифровку номера тематики " 0-395-36341-6" (наприклад: " квантова хімія").

URN масово використовується в P2P мережах (подібних edonkey).

Приклад URN вказує на образ диска Adobe Photoshop v8.0 в мережі edonkey:

urn: ed2k: // | file | Adobe Photoshop

v8.0.iso | 940769280 | b34c101c90b6dedb4071094cb1b9f2d3 | /

де:

ed2k - вказує на мережу

file - файл

Adobe Photoshop v8.0.iso - назва файлу

940769280 - розмір в байтах

b34c101c90b6dedb4071094cb1b9f2d3 - ідентифікатор файлу (обчислюється за допомогою хеш-функції)

URL - Uniform Resource Locators явно описує, як дістатися до об'єкту.

синтаксис:

< scheme>: < scheme-specific-part>

де:

scheme = " http" | " ftp" | " gopher" | " mailto" | " news" | " telnet" | " file" | " man" | " info" | " whatis" | " ldap" | " wais" |... - ім'я схеми

scheme-specific-part - залежить від схеми

Ім'я схеми - послідовність символів [a-z0-9 +.-].

У scheme-specific-part можна використовувати шістнадцяткові значення у вигляді: % 5f. Обов'язково повинні кодуватися недруковані октети: 00-1F, 7F, 80-FF. Також завжди кодуються " небезпечні" символи: " ", " < ", " > ", " " ", " # ", " % ", " {", " } ", " | ", " \ ", " ^ ", " ~", " [", " ]", " ` ". Деякі схеми резервують та інші символи: "; ", " / ", "? ", ": ", " @ ", " = " і" & ". їх також необхідно кодувати, якщо хочеться" обійти " їх спеціальне трактування. Таким чином залишаються [a-z0-9 $ -_. +! * '(), ] і резервовані символи в їх спеціальному значенні для даної схеми.

 

Схема HTTP. У схемі вказується її ідентифікатор, адреса машини, TCP-порт, шлях у директорії сервера, змінні та їх значення, мітка.

синтаксис:

http: // [< user> [: < password]> @] < host> [: < port> ] [/ [< url-path> ] [? < query> ]]

http - назва схеми

user - ім'я користувача

password - пароль користувача

host - ім'я хоста

port - номер порта

url-path - шлях до файлу і сам файл

query (< ім'я-поля> = < значення> {& < ім'я-поля> = < значення>) - рядок запиту

Визначений в RFC 2068. За замовчуванням, port = 80.

приклади:

https://ipm.kstu.ru/internet/index.php

Це найбільш поширений вид URI, застосовуваний в документах WWW. Слідом за ім'ям схеми (http) слід шлях, що складається з доменного адреси машини та повної адреси HTML-документа в дереві сервера HTTP.

В якості адреси машини допустимо використання і IP-адреси:

https://195.208.44.20/internet/index.php

Якщо сервер протоколу HTTP запущений на інший, відмінний від 80 порт TCP, то це відбивається в адресі:

https://195.208.44.20: 8080/internet/index.php

 

При вказівці адреси ресурсу можлива посилання на позначку всередині файлу HTML. Для цього слідом за ім'ям документа може бути вказана мітка всередині документа:

 

https://195.208.44.20/internet/index.php#metka1

Символ " #" відокремлює ім'я документа від імені мітки.

Змінні і їх значення передаються наступним чином:

https://ipm.kstu.ru/internet/index.php? var1=value1& vard2=value2

 

Значення " var1" і " var2" - це імена змінних, а " value1" і " value2" - їх значення.

Схема FTP. Дана схема дозволяє адресувати файлові архіви FTP.

синтаксис:

ftp: // [< user> [: < password]> @] < host> [: < port> ] [/ < url-path> ]

ftp - назва схеми

user - ім'я користувача

password - пароль користувача

host - ім'я хоста

port - номер порта

url-path - шлях до файлу і сам файл

Визначений в RFC 1738. За замовчуванням, port = 21, user = anonymous, password = email-адресу, якщо ім'я вказано, а пароль немає, то він запитується в діалозі.

< url-path> має вигляд:

< cwd1> / < cwd2> /.../ < cwdN> / < name> [; type = < typecode> ], де < typecode>:

 

< url-path> перетвориться клієнтської прграмма в набір команд

CWD < cwd1>

...

CWD < cwdN>

TYPE < typecode>

RETR < name>

приклади:

ftp: //ipm.kstu.ru/students/name/

Щоб вказати ім'я користувача і його пароль, треба записати так:

ftp: // name: password @ ftp: //ipm.kstu.ru/students/name/

В даному випадку ці параметри відокремлені від адреси машини символом " @", а один від одного двокрапкою.

 

Схема MAILTO. Данная схема предназначена для отправки почти.

 

синтаксис:

mailto: [< e-mail-1> {, < e-mail-2>,...}] [? < query> ]

mailto - назва схеми

e-mail-1 (< user> @ < host>) - перша адреса електронної пошти

user - ім'я користувача

host - ім'я хоста

e-mail-2 - другий адресу електронної пошти

query(< имя-поля-заголовка> =< значение> {& < имя-поля-заголовка> =< значение>) - Рядок запиту

приклади:

 

mailto: name@ipm.kstu.ru

 

У цій схемі передаються поля і їх значення:

приклад:

 

mailto: name@ipm.kstu.ru? subject = Тема_пісьма & body = Текст_которий _будет_вставлен_в_пісьмо

 

Адреса одержувача можна також записувати у вигляді значення поля to:

 

mailto:? to=name@ipm.kstu.ru? subject = Тема_пісьма & body = Текст_котрий _буде_вставлений_в_лист

 

Схема NEWS. Дана схема використовується для перегляду повідомлень системи Usenet.

синтаксис:

news: [< article> @ < group> ]

news - назва схеми

article - номер статті

group - назва групи

 

приклад:

 

news: comp.infosystems.gopher

 

В даному випадку можна отримати статті з групи " comp.infosystems.gopher" в режимі повідомлення. Можна отримати і текст статті, але в цьому випадку вказують її ідентифікатор:

 

news: 086@comp.infosystems.gopher

 

Замовлена 86 стаття з групи.

Схема NNTP. Це ще одна схема отримання доступу до ресурсів Usenet.

синтаксис:

nntp: [< group> / < article> ]

nntp - назва схеми

group - назва групи

article - номер статті

приклад:

У даній схемі звернення до групи comp.infosystems.gopher для отримання статті 86 буде виглядати так:

nntp: comp.infosystems.gopher / 086

Слід звернути увагу на те, що адреса сервера Usenet не вказано. Програма-клієнт повинна бути попередньо налаштована на роботу з одним з серверів Usenet. Сама служба Usenet є розподіленим інформаційним ресурсом, і група comp.infosystems.gopher на серверах містить одні й ті ж повідомлення.


Схема TELNET. За цією схемою здійснюється доступ до ресурсу в режимі віддаленого термінала. При використанні цієї схеми необхідно вказувати ім'я користувача та пароль.

синтаксис:

telnet: // [< user> [: < password]> @] < host> [: < port> ] /

telnet - назва схеми

user - ім'я користувача

password - пароль користувача

host - ім'я хоста

port - номер порта

За замовчуванням, port = 23.

приклад:

telnet: // name: password@ipm.kstu.ru

Схема FILE. Для локального режиму використовують схему FILE.

синтаксис:

file: // < host> / < path>

file - назва схеми

host - ім'я хоста

port - номер порта

path - шлях до файлу і сам файл

 

В якості < host> зазвичай вказується localhost

приклад:

file: /// C | /text/html/index.htm

С - диск файлової системи (для Windows)

Клієнт запускає тільки програми перегляду на основі MIME-типів з заголовка повідомлень сервера або з розширення файлу.

Стандартна узагальнена мо́ ва розмітки (англ. Standard Generalized Markup Language, SGML) це деяка метамова, на якій можна визначати мову розмітки для документів. SGML — нащадок розробленої в 1960 році в IBM мови GML(англ. en: Generalized Markup Language), яку не варто плутати з Geography Markup Language, яку розробляв Open GIS Consortium (https://opengis.net/gml/).

Спочатку SGML була розроблена для можливості спільного використання документів, що мають читатися машинами, у великих урядових та аерокосмічних проектах. Також вона широко використовується в друкувальній та видавничій сфері, але його складність документа ускладнила його широке розповсюдження для повсякденного використання.

Три основні частини SGML документа, це

- SGML декларація;

- Document Type Definition;

- зміст SGML-документа, принаймні, повинен бути кореневий елемент.

SGML надає множину варіантів синтаксичної розмітки для використання різними прикладними програмами. Змінюючи SGML Declaration можна навіть відмовитись від використання кутових дужок, хоча, цей синтаксис вважається стандартним, так званим concrete reference syntax.

Приклад SGML синтаксису:

< QUOTE TYPE=" example" > typically something like < ITALICS> this< /ITALICS> < /QUOTE>

SGML це стандарт ISO «ISO 8879: 1986 Information processing—Text and office systems—Standard Generalized Markup Language (SGML)»

Як HTML, так і XML похідні від SGML. HTML це деяка прикладна програма (застосування) на SGML, а XML це підмножина SGML, розроблена для спрощення процесу машинного розбору документа. Іншими прикладними програмами на SGML є SGML Docbook (документування), і «Z Format» (типографія та документування).

SGML вводить поняття типу документа і, як наслідок, визначення типу документа (document type definition, DTD). Тип документа формально визначається його складовими частинами та їх структурою. Наприклад, визначення звіту може констатувати, що він складається з заголовка, можливо, автора, за яким слідують анотація та один або кілька абзаців. Все, що не має заголовка, відповідно до цього формальним визначенням, звітом не є, так само, як не є ним послідовність абзаців, за якою слідує анотація, незалежно від того, наскільки такі документи схожі на звіт для читача-людини.

Раз документи мають відомі типи, можна використовувати спеціальну програму, що називається аналізатором (parser), для перевірки документа, який стверджує свою приналежність певному типу. Аналізатор перевіряє, що всі елементи, необхідні типом документа, насправді присутні і розташовані в правильному порядку. Що більш важливо, різні документи одного і того ж типу можуть оброблятися однаковим чином. Можна конструювати програми, що використовують знання структури документа, які, таким чином, можуть діяти в більш осмисленою манері.

Незалежність даних

Основна мета створення SGML полягала в тому, щоб забезпечити транспортабельність закодованих документів з однієї апаратної й програмної середовища в іншу без втрати інформації. Два описаних вище властивості вирішують цю задачу на абстрактному рівні; третя властивість - на рівні рядків байтів (символів), з яких складається документ. SGML надає універсальний механізмстроковой підстановки (string substitution), тобто, простий машинно-незалежний спосіб позначити, що деяка послідовність символів в документі повинна замінюватися при його обробці деякої іншої послідовністю. Одне очевидне застосування цього механізму - забезпечення узгодженості номенклатури; інше, і більш важливе, - протидія сумно відомої нездатності різних комп'ютерних систем розуміти набори символів один одного, або спосіб в будь-якій системі надати всі графічні символи, необхідні для конкретного додатка, шляхом використання описових позначень нестерпних символів. Рядки, визначені цим механізмом підстановки, називаються об'єктами (entities) і обговорюються нижче в розділі Об'єкти SGML.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.