Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Аналіз тексту






Наступний етап — аналіз тексту, під час якого потрібно виявити в самому тексті та у його форматуванні помилки, які мають бути усунені.

Переглядаючи файл, можна побачити, що перед текстом твору міститься сторонній текст (див. рис. 2.4). Такий текст є й у кінці файлу. Зокрема, перед текстом міститься абзац, де вказано, яким чином українізовано текст.


Українські літери «І», «і» набрано латинськими літерами «І», «і». Це призведе до ускладнень у разі використання автоматичних засобів перевірки орфографії. Тому латинські літери необхідно замінити українськими.

Текст набрано моноширинним шрифтом (Courier New), що є характерним для файлів формату TXT. (Нагадаємо, що моноширинним називають шрифт, у якому всі символи, незалежно від малюнку, мають однакову ширину, а отже, скажімо, літера «і» та літера «ш» займають у рядку однакове місце.) Нам потрібно замінити цей шрифт пропорційним, наприклад Times New Roman. Розмір шрифту (кегль) поки що залишається незмінним.
Включивши режим відображення прихованих символів, можна побачити, що абзацні відступи в усіх абзацах створено за допомогою трьох пробілів (рис. 2.5). Відступи у кінцевому документі мають бути задані за допомогою засобів форматування Microsoft Office Word.

 

Рис 2.5. Текст книги в режимі відораження прихованих символів.

 

Впадає в око і те, що символ абзацу «її» стоїть не лише в кінці абзаців тексту, а й у кінці кожного рядка. Зайві символи абзаців, зрозуміло, слід видалити.

Замість довгого тире «—» використовується дефіс «-», що є порушенням правил типографіки. Отже, знаки дефіса, що стоять на місці довгого тире, потрібно замінити. Довге тире, як ви знаєте, пишеться всередині речення або на початку прямої мови. Необхідно виявити всі фрагменти тексту, де має вживатися цей символ.

У тексті можуть зустрічатися знаки підкреслення «_», які є зайвими. їх потрібно видалити.

Не завжди після знаків пунктуації є пробіл, хоча правила типографіки вимагають його присутності. Тому необхідно додати пробіли, яких не вистачає.
Переводячи текст у інший формат, слід зберегти інтервал між абзацами та назвами розділів і підрозділів.

У багатьох місцях тексту між словами містяться по два-три зайвих пробіли, і їх, звісно, необхідно видалити.

У тексті є посилання на глосарій спеціальних термінів, їх потрібно оформити як виноски.

Тепер, коли недоліки тексту виявлено, потрібно скласти алгоритм їх усунення, який забезпечить можливість позбавитися всіх таких помилок і буде оптимальним з огляду на кількість операцій.

Існують два підходи до позбавлення недоліків. Один із них полягає в тому, щоб розв’язувати проблеми в порядку їх виявлення. Хоча на перший погляд це швидкий і продуктивний метод, він має суттєві вади. Уявіть, що на вашому комп’ютері оселився комп’ютерний вірус. За допомогою антивірусів побороти його не вдалося, і залишився останній метод — форматування жорсткого диска. Якщо ви поставите перед собою лише завдання знешкодити вірус, то відформатуєте жорсткий дискі позбавитесь шкідливих програм. Але зазвичай більш важливим завданням є збереження даних. Тож, перш ніж формату - вати диск, слід створити резервну копію даних з нього. Крім того, у разі зберігання даних на зовнішньому носії необхідно простежити за тим, щоб разом із ними туди не потрапив і вірус.

Таким чином, постає потреба в іншій концепції — системному підході до вирішення низки проблем. Нам необхідно чітко спланувати порядок і спосіб роботи з усіма виявленими проблемами та недоліками. При цьому слід пам’ятати: вирішувати одну проблему в такий спосіб, щоб завадити вирішенню інших, недопустимо. Передусім це стосується заміни символів. Наприклад, якщо ви на першому кроці алгоритму заміните всі символи абзацу пробілами, то не тільки позбавитеся зайвих символів абзацу, а й втратите ті абзаци, які мають бути в тексті. Іншими словами, ваш текст перетвориться на єдиний абзац, у якому, швидше за все, не вдасться знайти маркери, що дозволять знову розбити текст на абзаци хоча б уручну. Тому насамперед потрібно якимось чином виділити «справжні» символи абзаців і захистити їх від видалення. Один із прикладів того, як це робиться, наведено далі.






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.