Студопедия

Главная страница Случайная страница

Разделы сайта

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторикаСоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника






Формат збереження медичних зображень dicom






Вступ

Актуальність

Одним із найбільш перспективних напрямків дослідження перфузії є метод динамічної контрастної магнітно-резонансної томографії з введенням контрастної речовини автоматичним інжектором. Цей метод надає лікарям можливість оцінити накопичення контрастної речовини в тканинах а також динаміку цього процесу з визначенням кількісних часових параметрів накопичення контрасту. Динамічна контрастна МРТ значно полегшує проведення діагностичних заходів для пацієнтів із інсультами та пухлинами мозку.

Під час проведення перфузійної магнітно-резонансної томографії головного мозку отримують серію зображень в аксіальній площині до, під час та після введення контрастної речовини в кровоносну систему пацієнта. Зміна інтенсивності отриманого в дослідженні сигналу дозволяє отримати інформативні дані щодо перфузійних характеристик досліджуваних тканин. До основних перфузійних характеристик можна віднести об'єм крові, кровотік, середній час проходження контрасту.

Як правило, перед отриманням перфузійних характеристик тканини дані перфузійного аналізу фільтрують алгоритмами фільтрації для того, щоб сконцентрувати дослідження на певних тканинах та органах шляхом видалення з зображення неінформативних частин таких як очні яблука, мозолисте тіло мозку та фон. Розробка алгоритму фільтрації є важливою для вимірювання основних перфузійних характеристик, оскільки необхідно видалити неінформативні частини головного мозку такі як мозолисте тіло, очні яблука та фон.

Тому виконання досліджень, пов’язаних із подальшим розвитком методів і засобів адаптивної фільтрації перфузійних зображень є актуальна тема.

 

 

Мета

Метою роботи є розробка алгоритму адаптивної фільтрації зображень головного мозку, отриманих під час динамічної контрастної магнітно-резонансної томографії, від фону, очних яблук та мозолистого тіла.

Для досягнення поставленої мети були поставлені наступні задачі:

огляд завдання:

Задачі:

1) Реалізувати алгоритм бінаризації зображення;

2) Реалізувати алгоритми фільтрації зображень;

3) Реалізувати адаптивний фільтр зображень.

Об’єктом досліджень є зображення головного мозку отримані в результаті перфузійної магнітно-резонансної томографії.

Предметом досліджень є методи та алгоритми фільтрації зображень за їх істотними характеристиками.

Методи дослідження базуються на методах цифрової обробки зображень, фільтрації та бінаризації зображень.

 


1.

РОЗДІЛ 1 ЛІТЕРАТУРНИЙ ОГЛЯД ЗА ТЕМОЮ ІНДИВІДУАЛЬНОГО ЗАВДАННЯ

1.1 Теоретичні аспекти розробки адаптивної фільтрації зображень головного мозку

При роботі з зображеннями головного мозку отриманими під час перфузійної магнітно-резонансної томографії часто постає питання фільтрації даних зображень, видалення неінформативних частин зображення, що заважають дослідженню гемодинаміки в корі головного мозку. В випадку дослідження гемодинаміки в корі головного мозку, неінформативними є фон, очні яблука та мозолисте тіло кори головного мозку, ці частини треба видалити з зображення, оскільки вони будуть заважати обрахунку таких перфузійних характеристик як об'єм крові, кровотік, середній час проходження контрасту. Отже головною задачею фільтру буде видалення з зображення фону, мозолистого тіла та очного яблука.

Оскільки алгоритму доведеться фільтрувати зображення головного мозку отримані у різних зрізах, то постає питання адаптивності алгоритму до наявності на зображенні об’єктів, які потребують видалення, оскільки на різних зрізах можуть бути або присутні очні яблуку, або відсутні. Також, на зображеннях інтенсивність пікселів буде змінюватися з часом, що пов’язано з проходженням через тканини контрасту[19].

В загальному вигляді фільтр може залежати від наступних параметрів:

(1.1.1)

Де x, y – координати пікселю;

p(x, y) – ймовірність кольору пікселя;

f(x, y) – значення кольору пікселю;

F – отриманий фільтр.

В нашому конкретному випадку не доцільно будувати фільтр, що буде залежати від координат пікселю, оскільки на різних зрізах на одних і тих же координат можуть бути різні об’єкти. Також недоцільно для фільтру використовувати інтенсивність пікселю, оскільки вона буде змінюватися на різних фото одного і того ж зрізу. Очевидно, що задачу фільтрації можна поділити на дві частини[16]:

1) Фільтрація фону;

2) Видалення з зображення очних яблук та мозолистого тіла;

Для фільтрації фону доцільно використовувати бінаризацію зображень, завдяки якій об’єкт буде поділятися на дві частини: власне об’єкт та фон.

Для фільтрації зображень було запропоновано підхід, за яким береться гістограма кольорів зображення, обраховується значення ,

Де sd – стандартне відхилення;

m – математичне очікування.

Стандартне відхилення обраховується по формулі (1.1.2)

(1.1.2)

Де

n – обсяг вибірки;

– i-й елемент вибірки;

- середнє арифметичне вибірки.

Математичне очікування обраховується за формулою(1.1.3)

(1.1.3)

Де

n – обсяг вибірки;

– i-й елемент вибірки;

– вірогідність елемента вибірки.

Оскільки робота буде проходити з досить специфічним форматом збереження зображення доцільно розглянути процес отримання зображення та формат його збереження.

 

1.2 ПРИНЦИП РОБОТИ МАГНІТНО РЕЗОНАНСНОГО ТОМОГРАФА

Бурхливий розвиток комп’ютерної техніки з 70-х років 20 століття призвів до появи технічних засобів для реєстрації електромагнітного відклику атомних ядер, найчастіше атомів водню, при їх збудженню за допомогою комбінації електромагнітних хвиль у сталому магнітному полі високої напруженості.

Отримана інформації, а саме інтенсивність отриманого сигналу та координати джерела сигналу може інтерпретуватися у вигляді цифрового 2-х або 3-х вимірного зображення. Томографія дозволяє візуалізувати з високою якістю головний, спинний мозок та інші внутрішні органи. Але для подальшої роботи з отриманим зображенням, треба розуміти характер отриманої інформації.

Основними компонентами МРТ є основний магніт, система по випроміненою радіочастот, градієнтна котушка, система передачі інформації та комп’ютер[19].

 

 

Рисунок 1.2.1 – Спрощена модель магнітно-резонансного томографу

Основний магніт продукує сильне магнітне поле, що визначає розділову здатність МРТ. Як правило, в МРТ використовуються системи з надпровідних магнітів охолоджених до дуже низьких температур(близьких до абсолютного нуля). Надпровідний магніт складається з котушки, яка здатна утворювати потужне магнітне поле, за рахунок охолодження до наднизьких температур і зменшення опору провідників. В МРТ також використовуються дроти виплавлені зі сплаву Ніобію та Титану(NbTi), які мають дуже малий опір. В утворене магнітне поле можна вносити об’єкти до складу яких входять протони водню. Спіни протонів водню будуть вирівняні паралельно чи антипаралельно до діючого магнітного поля, причому більшість протонів буде вирівняна антипаралельно, що призведе до намагнічування тіла. В даному магнітному полю спіни протонів рецесивно обертаються з частотою, відомою як частота Лармора, значення якої залежить від сили зовнішнього магнітного поля. Якщо зовнішнє магнітне поле буде коливатися навколо частоти Лармора спіни протонів абсорбують додаткову енергію, електрони атому збудяться і перейдуть на більш високий енергетичний рівень, завдяки феномену магнітного резонансу. При чому, для збудження протонів на поверхні тіла частота Лармора має бути нижчою ніж для збудження протонів екранованих кістками та шкірою.

Енергія, якою збуджують протони водню продукується котушками МРТ, що передають цю енергію у вигляді смуги частот, з центральною частотою, що відповідає частоті Лармора. Спіни протонів водню, додатковою енергією переводяться у збуджений стан на деякий час, після чого вони повертаються у нормальне положення, причому надлишок енергії випромінюється у вигляді електромагнітної енергії чи радіації. Процес переходу спіну зі збудженого стану до нормального називається процесом релаксації. Під час цього процесу велика кількість диполів створюють на градієнтній котушці, що знаходиться навколо тіла, струми, сила яких фіксується і залежить від густини протонів у певній частині об’єкту. Отримана інформація передається по системі передачі інформації до комп’ютера де вона конвертується в зображення. Значення зареєстрованого струму конвертується в інтенсивність сірого(чим більша щільність тим яскравіший піксель), а координати зареєстрованого струму конвертуються в координати пікселю на зображенні.

Сигнал отриманий антеною являє собою суму сигналів отриманих в наслідок релаксації спінів, і не являє собою готове зображення. Формування зображення потребує значення магнітного градієнту для визначення просторової інформації, щодо отриманого сигналу. Система градієнту має багато функцій, таких як визначення зрізу, просторове декодування, перемотування та насичення зображень. Найважливішими з цих функцій є визначення зрізу та просторове декодування сигналу, вони дозволяють локалізувати місце утворення сигналу в середини об’єкту.

Система градієнту складається з трьох градієнтних котушок, розташованих довкола основного магніту в трьох ортогональних осях. Магнітні градієнти діляться на градієнт зрізу (Gz), градієнт фази (Gy) та градієнт частоти (Gx). Градієнт зрізу застосовується в період релаксації, таким чином тільки спіни з відповідного зрізу відповідають. Градієнт частоти та фази застосовується перед чи підчас зняття дати антеною. Таким чином, просторова інформація записується в отриманий сигнал.

Просторова інформація та інтенсивність сигналу записується в зображення у вигляді координат та кольору. Інформація записана в кольорі може бути подана в декількох кольорових системах: Red, Green, Blue(RGB), Cyan, Magenta, Yellow(CMY). Отримане зображення досить часто є зашумленим, тому потребує додаткової фільтрації перед обробкою. Також, для поліпшення якості зображення, інтенсивність часто накладають на підготовлені контури органу, що сканується, таким чином можна краще виділяти області мозолистого тіла, очних яблук головного мозку. Для подальшої обробки зображення також можлива сегментація отриманого зображення з метою виділення окремих органів, або інших структур. Так наприклад, при скануванні головного мозку на наявність меланоми дані отримані з області очних яблук не є важливими, тому їх з зображення можна видалити.

Отримане зображення та додаткова інформація, як ім’я пацієнта, дата та обладнання на якому було проведено аналіз, інтенсивність зареєстрованого сигналу, кількість зрізів та відстань між ними зберігається у DICOM форматі для подальшої обробки та збереження.

1.2.1 Оптимізація сигналу

Магнітне поле, утворене надпровідним магнітом накладається на магнітне поле всередині кабінету де проводиться дослідження, таким чином гомогенність утвореного магнітного поля всередині томографу порушується, що впливає на якість вихідного зображення. Порушення гомогенності магнітного поля виливаються у випадінні цілих регіонів зображення та неможливості декодувати просторову інформацію отриманого сигналу. Для проведення нормального дослідження вихідне магнітне поле треба відкалібрувати. Гомогенність магнітного поля вимірюється через спад вільної індукції сигналу за відсутності полів градієнту.

Гомогенність магнітного поля відновлюється за допомогою випромінення додаткового електромагнітного сигналу котушками. Операція проводиться автоматично перед кожним дослідженням.

Сигнали отримані на котушці записуються в пам’яті комп’ютера, з них формується зображення, за допомогою математичних алгоритмів, таких як трансформація Фур’є. Складність процесу відтворення зображення полягає в кількості та складності вимірювання параметрів таких як час збудження та релаксації спіну, струм індукований на сенсорній котушці.

1.2.2 Перфузійна магнітно-резонансна томографія

Одним з найбільш перспективних методів магнітно-резонансної томографії є метод динамічної магнітно-резонансної томографії з введенням контрастної речовини автоматичним інжектором. Проходження контрастної речовини по тканинам організму дозволяє лікарю оцінити кількісні та часові параметри накопичення та виведення контрастної речовини з тканини. Динамічна контрастна МРТ значно полегшує проведення діагностичних заходів для пацієнтів із інсультами та пухлинами мозку.

Під час проведення перфузійної магнітно-резонансної томографії головного мозку отримують серію зображень в аксіальній площині до, під час та після введення контрастної речовини в кровоносну систему пацієнта. Зміна інтенсивності отриманого в дослідженні сигналу дозволяє отримати інформативні дані щодо перфузійних характеристик досліджуваних тканин. Послідовне отримання серії зображень протягом дослідження надає дані для побудови моделі кровопостачання в різних частинах мозку. За рахунок обробки перфузійних даних магнітно-резонансного дослідження отримують кількісні показники перфузійних характеристик тканин на томографічному зрізі в певній області, так і візуальні, так звані перфузійні карти заданої області. До основних перфузійних характеристик можна віднести об'єм крові, кровотік, середній час проходження контрасту.

 

 

ФОРМАТ ЗБЕРЕЖЕННЯ МЕДИЧНИХ ЗОБРАЖЕНЬ DICOM

За останні 15 років був розроблений галузевий стандарт створення, зберігання, передачу та візуалізації медичних зображень та документів отриманих під час обстеження пацієнтів Digital Imaging and Communications in Medicine(DICOM). Зародився стандарт для обслуговування потреб радіології в 1993 році в Американському коледжі радіології, в наш час широко використовується в таких сферах як кардіологія, онкологія та інші. З 2006 року являється міжнародним ISO стандартом.

Рисунок 1.3.1 – приклад типового DICOM файлу

Стандартом DICOM визначено два інформаційних рівня:

1) Файловий рівень(DICOM file) – об’єктно-орієнтований DICOM файл з індексною системою організації інформації для представлення кадру зображення(чи серії кадрів) та додаткової інформації в вигляді DICOM тегів;

2) Мережевий рівень(DICOM Network Protocols) – протокол для передачі DICOM файлів та DICOM команд керування по мережам з підтримкою TCP/IP.

DICOM файл – це об’єктно-орієнтований файл, що складається з багатьох об’єктів, що описують ті чи інші аспекти медичного дослідження: ЕКГ, зображення, ім’я пацієнту, назва інституту де проводилося дослідження та інші, таким чином формат DICOM є композитним форматом. Різні аспекти дослідження згруповані в Information Object Definitions(IODs)[24]. IOD складається з короткого опису об’єкту та таблиці атрибутів та значень. Атрибут має свій унікальний ідентифікатор, що складається з 16-бітного числа записаного у шістнадцятирічній системі та ім’я, що описує який тип інформації зберігає атрибут. Значення атрибуту не тільки логічно пов’язано з його іменем але прив’язане до одного з 27 типів даних, що називаються Value representatives(VR)[8]. До цих типів даних входять числові, текстові, коди, ім’я пацієнту, бінарний. Кожен атрибут може зберігати одне чи декілька значень, що вказано у його Value Multiplicity(VM). Якщо VM – 1, то поле зберігає одне значення, якщо значення VM – n, то поле може зберігати n різних значень.

Рисунок 1.3.2 – Таблиця атрибутів та значень

 

Таким чином, DICOM файл утворений з атрибутів, що належать до різних таблиць.

DICOM файл має чотирьох ступінчату інформаційну модель згідно з якою усі об’єкти належать до одного з наступних рівнів ієрархії[27]:

1) Серія(Series) – кожен об’єкт належить до однієї серії, і тільки до неї;

2) Дослідження(Study) – кожна серія належить до одного дослідження, і тільки до нього;

3) Пацієнт(Patient) – кожне дослідження належить лише одному пацієнту;

Причому, пацієнт може мати декілька досліджень, дослідження декілька серій, а серія декілька об’єктів. Серія може містити лише зображення отримані на одному типі медичного обладнання: кардіографу, рентгену або томографу.

Особливу увагу варто приділити DICOM Image IOD, що визначає атрибути для збереження медичних зображень: інформацію про пікселі, та механізм їх візуалізації. Також зберігаються наступні атрибути:

1) Роздільна здатність(Image resolution) – атрибут зберігає ширину та висоту зображення;

2) Фотометричну модель(Photometric interpretation) – атрибут зберігає кольорову модель пікселів. Можливі варіанти RGB, YCbCr або монохромні чи з палітри кольорів;

3) Представлення пікселю(Pixel representation) – зберігає за якою шкалою вимірювалося значення піселю;

4) Кількість каналів(Samples per pixel) – атрибут зберігає кількість каналів кольорів;

5) Кількість кадрів(Number of frames) – атрибут, що зберігає кількість кадрів у зображенні;

6) Значення пікселів(Pixel data) – атрибут зберігає значення пікселю;

 

Мережевий рівень використовує протокол для передачі медичної інформації отриманої від медичного обладнання. Стандарт дозволяє проводити інтеграцію обладнання від різних виробників в єдину інформаційну систему.

Стандарт DICOM включає в себе ряд мережевих сервісів:

1) DICOM Store – сервіс збереження DICOM файлів;

2) DICOM Query – запит/отримання DICOM файлів;

3) DICOM Media Store – збереження DICOM файлів на носіях інформації;

4) DICOM Service Class Provider – реалізує роль сервера в DICOM мережах;

5) DICOM Service Class User – реалізує роль клієнта в DICOM мережах;

6) DICOM Print – сервіз друку DICOM файлів на спеціалізованих DICOM- принтерах;

 

Для роботи з медичними зображеннями DICOM сьогодні доступні різні інструменти, які умовно можна розділити на наступні категорії:

1) Бібліотеки, що можуть імпортуватися в проект програмного забезпечення і надавати необхідний функціонал для роботи зі стандартом DICOM;

2) Програмне забезпечення, з можливістю розширення стороннім кодом;

Оскільки в рамках дипломної роботи буде розроблятися власне програмне забезпечення, тому варто приділити увагу бібліотекам по роботі з DICOM файлами:

1) Medical Imaging Toolkit – бібліотека надає функціонал для візуалізації, сегментації та вимірювання зображень формату DICOM. В бібліотеці відсутній функціонал мережевого рівня стандарту.

2) OFFIS DICOM Toolkit – бібліотека концентрується на мережевому рівні стандарту DICOM, має функціонал для розробки серверу файлів, клієнта, відправки та збереження файлів DICOM. Бібліотека може зчитувати атрибути файлів, але не має методів для відображення зображень.

3) Grassroots DICOM Toolkit – бібліотека, що підтримує зчитування, роботу та запис DICOM зображень, незалежно від їх компресії. Бібліотека не має методів для мережевого програмування та відображення зображень.

4) Pixelmed – бібліотека, що підтримує зчитування, створення, збереження DICOM файлів, відображення зображень, збереження файлів у спеціалізованій базі даних, в рамках бібліотеки реалізовано функціонал мережевого рівня стандарту.

У дипломній роботі для роботи з форматом DICOM була відібрана бібліотека pixelmed, оскільки вона підтримує роботу з зображеннями, їх зчитування, збереження, створення та має підтримку мови програмування Java.

 

1.4 АЛГОРИТМИ БІНАРИЗАЦІЇ ЗОБРАЖЕНЬ

Під час обробки зображень постає завдання видалити неінформативні частини зображення за тою чи іншою характеристикою. Наприклад, колір пікселів фону зображення значно відрізняється від кольору пікселів об’єкту, тому за кольоровою характеристикою можна видалити неінформативний фон, залишивши лише потрібний об’єкт. Слід зазначити, що не існує універсального алгоритму бінаризації зображень, кожен випадок вимагає аналізу та підбору оптимального рішення. Результатом алгоритму бінаризації є бінарне зображення, де одним кольором буде зафарбована неінформативна частина зображення, а іншим – інформативна. В залежності від потреби, одна частина зображення може бути забарвлена в чорний, а інша – білий[13].

Бінаризація зображень використовується в таких задачах як фільтрація зображень отриманих шляхом рентгенівського випромінення, магнітно-резонансної томографії, ультразвукового та лазерного сканування

В нашому конкретному завданні бінаризація буде використовуватися для видалення з зображення головного мозку зашумленого фону.

1.4.1 Класифікація алгоритмів бінаризації

В загальному випадку алгоритм бінаризації може бути представлений у вигляді формули[1.4.1.1]:

(1.4.1.1)

Де T – значення бінаризації;

x, y – координати пікселю;

f(x, y) – значення кольору пікселя;

p(x, y) – ймовірність кольору пікселя.

 

(1.4.1.2)

Де g(x, y) – новий колір пікселю: чорний або білий;

f(x, y) – оригінальний колір пікселю;

Т – значення бінаризації.

Таким чином, дивлячись на характеристики зображення на основі яких ми будемо проводити бінаризацію(x, y, p(x, y), f(x, y)) можна виділити шість категорій алгоритмів бінаризації[2]:

1) Алгоритми бінаризації побудовані на основі аналізу гістограм кольору. Аналізуються локальні максимуми, мінімуми та криві гістограми;

2) Алгоритми бінаризації побудовані на основі методів кластеризації, де пікселі зображення розділяються на два кластера: ті що належать до фону, та ті що належать до об’єкту, як правило кластери відповідають пікам гістограми кольорів зображення;

3) Алгоритми бінаризації побудовані на основі вимірювання ентропії зображення. В рамках цього підходу пікселі розділяються на дві категорії, в рамках котрих ентропія мінімізується, а між ними – максимізується, також можливі варіанти коли ентропія між вхідним зображенням та вихідним мінімізується, таким чином досягається збереження інформації яку несе зображення;

4) Алгоритмы бінаризації побудовані на основі вимірювань специфічних атрибутів об’єкту на зображенні. Алгоритм будується на вимірюванні подібності оригінального зображення та зображення отриманого внаслідок бінаризації, та виявлення найкращого. Порівнюватися можуть кути об’єктів, форму об’єктів та текстури;

5) Просторові алгоритми бінаризації побудовані на основі вимірювання кореляції між пікселями.

6) Локальні алгоритми бінаризації можуть використовувати усі попередні алгоритми для знаходження значення бінаризації T, але при цьому бінаризація буде проводитися для зображення поділеного на декілька частин.

Слід зазначите, що хоча формально результатом алгоритму бінаризації є двокольорове зображення з чорним фоном і білим об’єктом, може бути реалізований алгоритм, що розбиває зображення на значно більше частин в залежності від потреби. Так наприклад, таким алгоритмом може бути видалене мозолисте тіло та фон з зображення головного мозку.

Така формула буде мати вигляд:

(1.4.1.3)

Де g(x, y) – новий колір пікселю;

f(x, y) – оригінальний колір пікселю;

Т – значення бінаризації;

a, b, c – кольори пікселю.

 

1.4.2 Вибір алгоритмів бінаризації

Для видалення фонового шуму з зображень головного мозку отриманих в результаті перфузійного магнітно-резонансної томографії будуть використовуватися наступні алгоритми бінаризації[7]: кластерний алгоритм Отсу, алгоритм бінаризації на базі ентропії Шеннона, алгоритм збалансованої гістограми, що аналізує кольорову гістограму зображення та алгоритм локальної бінаризації побудований на базі алгоритму Отсу.

 

Для представлення роботи алгоритмів бінаризації було використано зображення 03011.dcm

Рисунок 1.4.2.1– Зображення 03011.dcm використане для ілюстрації алгоритмів бінаризації

Рисунок 1.4.2.2– Гістограма кольорів зображення 03011.dcm

1.4.3 Алгоритм бінаризації Отсу

Алгоритм Отсу, названий в честь свого автора Нобуюкі Отсу, є одним з алгоритмів бінаризації зображення шляхом розбиття його на два кластери: один відповідає за фон, інший за об’єкт[18]. Метод Отсу шукає поріг, що зменшує дисперсію всередині класу, що визначається як зважена сума дисперсій двух класів(1.4.3.1):

(1.4.3.1)

Де t – поріг бінаризації;

– дисперсія класів;

– вірогідність обох класів.

 

Алгоритм:

Нехай дано монохромне зображення , лічильник повторів k=0.

Будуємо гістограму кольорів зображення та частоту для кожного рівня інтенсивності зображення G;

Обчислюємо початкові значення для ;

Для кожного значення – рівня інтенсивності(горизонтальна вісь гістограми):

1) Оновлюємо ;

2) Рахуємо за формулою (1.4.3.1)

3) Якщо значення більше за наявне, то зберігаємо та значення порога t;

4) Шуканий поріг відповідає максимуму

Результат алгоритму бінаризації Отсу для зображення 03011.dcm

Рисунок 1.4.3.1– Результат роботи алгоритму бінаризації Отсу

Недоліки метода Отсу:

1) Алгоритм дає погані результати якщо два класи сильно відрізняється;

2) Алгоритм дає погані результати коли на кольоровій гістограмі зображення не є бімодальною[2].

3) Алгоритм буде погано працювати, якщо на гістограмі кольорів присутні більше двох глобальних максимумів[12];

4) Метод дає погані результати при освітленому зображенні[12].

 

1.4.4 Алгоритм бінаризації Шеннона

В 1948 Клод Шеннон сформулював визначення ентропії для теорії інформації. В теорії інформації ентропія означає рівень невизначеності стосовно деякої події з даним розподілом вірогідностей. В сфері оброки зображень підрахунок ентропії широко застосовується, щоб виділити з зображення об’єкти з подібними характеристиками. В бінаризації формула ентропії Шеннона використовується для розділення зображення на два класи A і B, шляхом максимізації ентропії між ними (1.4.4.3):

,

(1.4.4.1)

(1.4.4.2)

W(t) =

(1.4.4.3)

Де W(t) – рівень ентропії;

А(t), В(t) – ентропія класів;

– частота рівня інтенсивності.

 

Алгоритм:

Нехай дано монохромне зображення , лічильник повторів k=0.

1) Будуємо гістограму кольорів зображення та частоту для кожного рівня інтенсивності зображення G;

2) Обчислюємо початкові значення для W(0);

3) Для кожного значення – рівня інтенсивності(горизонтальна вісь гістограми):

4) Розрахуємо W(t) за формулою (1.4.4.3);

5) Якщо значення W(t) більше за наявне, то зберігаємо W(t) та значення порога t;

6) Шуканий поріг відповідає максимуму W(t).

 

Результат алгоритму бінаризації Шеннона для зображення 03011.dcm

Рисунок 1.4.3.1– Результат роботи алгоритму бінаризації Шеннона

 

Недоліки алгоритму Шеннона[28]:

1) Алгоритм дає погані результати коли глобальні максимуми погано виражені на гістограмі кольорів;

2) Алгоритм буде погано працювати, якщо на гістограмі кольорів присутні більше двох глобальних максимумів;

3) Алгоритм дає погані результати коли глобальні максимуми погано виражені.

 

1.4.4 Збалансований алгоритм бінаризації

Збалансований алгоритм бінаризації побудований на аналізі форми гістограми кольорів. В рамках методу відбувається зважування гістограми до порогу бінаризації і після. Важче плече гістограми видаляють поки воно не стає легшим, поріг бінаризації здвигають в сторону легшого плеча. Процес повторюється поки не буде знайдена рівновага[6].

 

 

Алгоритм:

Нехай дано монохромне зображення , лічильник повторів k=0.

1) Будуємо гістограму кольорів зображення та частоту для кожного рівня інтенсивності зображення G;

2) Знаходимо центр гістограми та обчислюємо початкові значення для лівого і правого плеча;

3) Поки ліве та праве плече не зрівноважене виконуємо:

4) З важчого плеча видаляємо стовбець гістограми, поріг бінаризації зміщуємо у напрямку до легшого плеча;

5) Шуканим порогом бінаризації буде знайдений центр рівноваги гістограми.

 

Результат збалансованого алгоритму бінаризації для зображення 03011.dcm.

Рисунок 1.4.4.1– Результат роботи збалансованого алгоритму бінаризації

 

Недоліки збалансованого алгоритму:

1) Алгоритм дає дуже погані результати на зачумлених картинках. Рекомендується фільтрувати гістограму видаляючи репрезентативні стовпчики гістограмі на початку та в кінці;

2) Алгоритм погано працює на монохромних зображеннях з великою кількістю тонів сірого;

3) Алгоритм погано працює, якщо на гістограмі не виражених двох глобальних максимуми;

4) Алгоритм не підлягає модифікації під специфічні задачі(як наприклад розбиття зображення на декілька класів)[17].

1.4.5 Локальний алгоритм бінаризації Отсу

Локальний алгоритм бінаризації на базі алгоритму Отсу побудований на припущенні, що якщо розділити зображення не декілька частин і провести бінаризацію кожної частини окремо, можна уникнути чи мінімізувати проблеми пов’язані з неоднорідністю гістограми зображення, відсутністю чітко виражених піків на гістограмі, зашумленістю окремих частин. Це пов’язано з тим, що кожна окрема частина зображення містить менше класів об’єктів, тому виділити бімодальну гістограму легше. Далі бінарні зображення склеюється і повертаються в точку виклику[21].

 

Алгоритм:

Нехай дано монохромне зображення , лічильник повторів k=0.

1) Ділимо зображення на n частин, отримуємо і для кожної частини зображення виконуємо наступні дії:

2) Будуємо гістограму кольорів зображення та частоту для кожного рівня інтенсивності зображення G;

3) Обчислюємо початкові значення для ;

4) Для кожного значення – рівня інтенсивності(горизонтальна вісь гістограми);

5) Оновлюємо ;

6) Рахуємо за формулою (1.4.3.1);

7) Якщо значення більше за наявне, то зберігаємо та значення порога t;

8) Шуканий поріг відповідає максимуму

З’єднуємо зображення у відповідному порядку. Отримане зображення – бінаризоване вихідне зображення.

 

Результат локального алгоритму бінаризації Отсу для зображення 03011.dcm

Рисунок 1.4.5.1– Результат роботи локального алгоритму бінаризації Отсу

 

Недоліки локального алгоритм бінаризації Отсу:

1) Алгоритм залишається чутливим до не бімодальних гістограм, хоча менше ніж базовий алгоритм Отсу[10];

2) Алгоритм чутливий до помилок пов’язаних з відсутністю на гістограмі чітко виражених піків, але це не так критично через відсутність інформативного об’єкту на деяких частинах зображення;

3) Алгоритм відносно складніший за базовий алгоритм Отсу[22].

 

 

1.5 АЛГОРИТМИ ФІЛЬТРАЦІЇ ЗОБРАЖЕНЬ

Обробка медичних зображень як окрема категорія знань почала досить активно розвиватися з початку 1990-х років коли з’явилися технічне обладнання здатне реєструвати медичні сигнали, конвертувати їх в зображення та обробляти. Основними постачальниками таких зображень є магнітно-резонансні томографи, позитронно-емісійні томографи, рентгени та сонографи. Постачальники медичних зображень зумовлюють технічні особливості цих зображень, оскільки апаратура реєструє не видимий спектр електромагнітного випромінення, а магнітний резонанс чи відбиті звукові сигнали[15]. Обладнання фіксує інтенсивність відбитого сигналу та його координати, тобто основна задача реконструкції медичних зображень полягає в інтерпретації отриманої інтенсивності в форму, що сприймається очима та розміщення джерел сигналу у відповідному місці на полотні зображення. Але проблема постає на етапі фіксації: медичні зображення часто характеризуються грубим розподіленням сірих тонів, слабким контрастом та шумом. Чим швидше знімаються зображення тим гірша якість медичних зображень. Для позбавлення зображень шуму та різких піків інтенсивності перед подальшим аналізом, зображення необхідно фільтрувати[23].

В роботі реалізовано два фільтри: фільтр Гауса та низькочастотний фільтр, обидва фільтри належать до класу фільтрів розмиття.

Для ілюстрації роботи фільтрів було використано зображення 03035.dcm

Рисунок 1.5.1– Зображення 03035.dcm

1.5.1 Фільтр Гауса

Фільтр Гауса застосовується для зменшення зашумленості зображення та зменшення його різкості. Візуально Гаусова фільтрація проявляється в розмитті зображення, що досягається за рахунок розгладженні гістограми кольору[13]. Математично, фільтр Гауса полягає в згортці зображення з функцією Гауса:

(1.5.1.1)

Де g(x, y) – значення функції Гауса;

x, y – дистанція від центру матриці Гауса;

– середньоквадратичне відхилення відносно математичного сподівання функції Гауса.

 

Алгоритм:

Нехай дано монохромне зображення .

1) Ініціалізуємо ядро фільтра Гауса розміром 3х3 за допомогою функції Гауса (1.5.1.1);

2) Для кожного пікселю по горизонталі :

· Беремо матрицю 3х3 та згортуємо її з ядром Гауса, центру матриці зображення присвоюємо отриманий результат;

· Отримане зображення – вихідне відфільтроване зображення.

3) Результат роботи алгоритму фільтрації Гауса на прикладі зображення

 

1.5.2 Фільтр низьких частот

Фільтр низьких частот застосовується для розмиття зображення: розмиваються піки інтенсивності кольору на зображенні, також фільтр дозволяє відфільтрувати шум, особливо представлений локальними піками інтенсивності кольору на зображенні.

 

Алгоритм:

Нехай дано монохромне зображення .

1) Для кожного пікселю по горизонталі :

2) Беремо матрицю розмірністю 3х3 ;

3) Рахуємо середнє математичне для всіх елементів матриці;

4) Присвоюємо значенню обраховане середнє математичне матриці.

5) Отримане зображення – вихідне відфільтроване зображення.

Легко можна побачити, що обидва фільтри не беруть у рахунок крайні пікселі. Цю проблему можна вирішити у два способи:

1) Додати до зображення додатковий ряд пікселів по краях ідентичний крайнім пікселям;

2) Ігнорувати крайні пікселі та фільтрувати лише уcі інші.

Я застосовував другий підхід, оскільки в моєму випадку крайні пікселі не інформативні.

1.6 АЛГОРИТМ БІНАРИЗАЦІЇ ЗОБРАЖЕННЯ ЗА ВВЕДЕНИМИ КОРИСТУВАЧЕМ ПАРАМЕТРАМИ

Під час аналізу зображення головного мозку отриманого метод перфузійної магнітно-резонансної томографії постає задача видалення неінформативних частин зображення, що заважають автоматичному отриманню перфузійних характеристик тканин. До не інформаційних частин можна віднести фон зображення, котрий може містити шуми, що будуть заважати обчисленням та у нашому випадку мозолисте тіло мозку. Обидва об’єкти: мозолисте тіло мозку та фон, за кольоровою характеристикою можна віднести до різних з півкулями головного мозку об’єктів.

Досить часто півкулі виокремлюють з зображення за допомогою алгоритмів фільтрації зображення, але інколи постає завдання розділити зображення на класи «на око». Для цієї задачі був реалізований алгоритм бінаризації за введеними користувачем параметрами. Суть алгоритму заклечається в тому, що значення порогу бінаризації вибирається на око базуючись на доступних гістограмах кольору зображення.

Математично даний алгоритм можна представити у вигляді системи (1.6.1):

 

(1.6.1)

Де g(x, y) – новий колір пікселю;

f(x, y) – оригінальний колір пікселю;

Т – значення порогів бінаризації, введених користувачем;

a, b, c – кольори пікселю.

 

Алгоритм:

Нехай дано монохромне зображення

1) Будуємо гістограму кольорів зображення та частоту для кожного рівня інтенсивності зображення G;

2) Зчитуємо пороги бінаризації введені користувачем;

3) Проводимо бінаризації зображення по формулі (1.4.1.3);

4) Отримане зображення – вихідне бінаризоване зображення

 

РОЗДІЛ 2 ОСНОВНА ЧАСТИНА






© 2023 :: MyLektsii.ru :: Мои Лекции
Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав.
Копирование текстов разрешено только с указанием индексируемой ссылки на источник.