Biến đổi đa phân giải có hướng ứng dụng trong phân tích vi ảnh

BIẾN ĐỔI ĐA PHÂN GIẢI CÓ HƯỚNG ỨNG DỤNG TRONG PHÂN TÍCH VI ẢNH NGÔ QUỐC VIỆT Trang nhan đề Lời cam đoan Lời cảm ơn Mục lục Danh mục hình ảnh Chương 1: Giới thiệu Chương 2: Xác định biên trong vi ảnh dựa trên cực trị Wavelet Chương 3: Các thuật giải phân đoạn ảnh Chương 4: Phép biến đổi đa phân giải có hướng cục bộ Chương 5: Phân tích vi ảnh dựa trên biến đổi đa phân giải có hướng Chương 6: Kết luận và hướng kiến nghị Danh mục công trình tác giả Tài liệu tham khảo Phụ lục

pdf13 trang | Chia sẻ: lvcdongnoi | Lượt xem: 3166 | Lượt tải: 2download
Bạn đang xem nội dung tài liệu Biến đổi đa phân giải có hướng ứng dụng trong phân tích vi ảnh, để tải tài liệu về máy bạn click vào nút DOWNLOAD ở trên
12 CHƢƠNG 1: GIỚI THIỆU 1.1. Mở đầu Giai đoạn gần đây, các nghiên cứu về cấu trúc nano ngày càng phát triển trong nhiều lĩnh vực. Đây là ngành khoa học nghiên cứu sự tác động của các cấu trúc ở kích thƣớc nano và đƣợc ứng dụng vào các lĩnh vực khác nhau nhƣ: điện tử nano, sinh học nano, vât liệu nano, v.v. Đây là lĩnh vực rất quan trọng và đƣợc dự báo là sẽ phát triển mạnh trong những năm tới [21], [78], trong đó vai trò của khoa học máy tính trợ giúp công nghệ nano ngày càng rõ nét. Sự phát triển khoa học công nghệ nano liên hệ mật thiết với các tiến bộ trong ngành khoa học máy tính. Việc quan sát, phân tích và thao tác đƣợc trên các đối tƣợng kích thƣớc nano mét, phân tử, sẽ đóng góp rất nhiều cho khoa học và công nghệ nano. Trong đó việc tạo ảnh chụp các đối tƣợng kích thƣớc nhỏ là yếu tố quan trọng cho các phân tích thủ công hay tự động ở các giai đoạn sau. Một số kỹ thuật tạo vi ảnh nhƣ Scanning Probe Microscopy (SPM) [25], hay Atomic Force Microscopy (AFM) [3][5], Scanning Tunneling Microscopy (STM) [8], AFM và Near-field Scanning Optical Microscopy (NSOM), Magnetic Force Microscopy (MFM), Lateral Force Microscopy (LFM), Electrostatic Force Microscopy (EFM), v.v. cho phép tạo đƣợc ảnh bề mặt ở độ phân giải nano. Các kỹ thuật tạo ảnh trên đã mở ra hướng nghiên cứu sử dụng vi ảnh để giải quyết các vấn đề trong rất nhiều lĩnh vực như công nghệ sinh học, bán dẫn, sản xuất vi mạch, v.v. Thuật ngữ vi ảnh đƣợc xem nhƣ ảnh chụp các đối tƣợng có kích thƣớc nhỏ (kích thƣớc nano mét hay micro mét) thông qua các kỹ thuật tạo ảnh đặc biệt. Trong luận án này, chúng tôi nghiên cứu và phát triển các thuật giải trên tập vi ảnh Scanning Electron Microscopy (SEM), STM chụp bề mặt wafer dùng trong công nghệ bán dẫn, ảnh DNA microarray, và vi ảnh huỳnh quang (fluorescence microscopy) dùng trong vi sinh học. 13 Trong ngành công nghệ bán dẫn, ảnh SPM đƣợc dùng để hỗ trợ một số công đoạn sản xuất wafer nhƣ giám sát quá trình phủ các lớp vật chất lên bề mặt, đo độ phẳng, xác định lỗi v.v. Trong lĩnh vực sinh học, SPM có thể cung cấp ảnh ba chiều các bề mặt phân tử trong môi trƣờng lỏng hay khí. Thông qua chuỗi các vi ảnh, ta có thể nghiên cứu các quá trình diễn ra trong DNA (nhƣ đột biến, lai ghép, v.v) ở mức độ phân tử. Việc chẩn đoán bệnh (nhƣ kiểm tra phổ gen) cũng đƣợc sự hỗ trợ bằng các kỹ thuật nhận dạng mẫu và tìm kiếm trong ngân hàng phổ gen. Với kỹ thuật SPM, ta có thể quan sát chuỗi ảnh thể hiện ở mức độ tế bào hay protein, cấu trúc màng tế bào và hơn nữa là hiểu tính năng của chúng thông qua các phƣơng pháp có sự trợ giúp của các kỹ thuật phân tích ảnh. Kỹ thuật AFM có thể tạo đƣợc ảnh trong môi trƣờng lỏng hay khí nhờ sự tƣơng tác của nó với các phân tử. Trong các ứng dụng polymer, SPM có thể giúp nghiên cứu ở mức hình thái hay cấu trúc nano. Ở độ phân giải cao, SPM cho phép „chụp‟ nhằm xác định đƣợc tính chất vật liệu, cấu tạo bề mặt ở mức độ định tính và định lƣợng thông qua một số phƣơng pháp trích đặc trƣng ảnh, đặc biệt là đặc trƣng đa tỉ lệ. Vấn đề khó khăn khi xử lý các lớp ảnh chụp bề mặt các wafer bán dẫn hay các tế bào là hầu nhƣ các đặc trƣng không thể mô tả tƣờng minh dạng nhƣ “chữ C có hình cong và hai đầu không chạm nhau” hay “hai mắt đối xứng qua trục dọc trên mặt ngƣời”, v.v. Các vi ảnh thƣờng có các tính chất sau  Màu sắc trải đều và phân bố ngẫu nhiên.  Các đối tƣợng hay đặc trƣng gần nhƣ không thể mô tả tƣờng minh.  Yếu tố nhiễu có tác động rất lớn đến quy trình xử lý. Đặc biệt trong lĩnh vực sản xuất vi mạch bán dẫn, phân biệt giữa vi lỗi và nhiễu là nhu cầu cần thiết. Hình 1.1 thể hiện sự khác biệt giữa vi lỗi và nhiễu có trong ảnh chẩn đoán lỗi của một trong các công đoạn của quy trình sản xuất vi mạch bán dẫn. Trong hình minh hoạ này, số lƣợng điểm ảnh của nhiễu hay vi lỗi có vẻ tƣơng đƣơng, nhƣng hình dáng hay hƣớng hoàn toàn khác nhau. Điều này có thể dẫn đến trở ngại khi phân tích trực tiếp trên dữ liệu ảnh. 14 Hình 1.1-Minh hoạ khác biệt giữa vi lỗi và nhiễu Trong ngành công nghệ sinh học, song song với vấn đề xây dựng bản đồ gen, một hƣớng nghiên cứu quan trọng khác hƣớng đến phân tích chức năng protein. Các tiếp cận trƣớc đây chủ yếu thực hiện nhu cầu này dựa trên việc phân tích chuỗi gen một chiều, sử dụng CSDL ngân hàng gen và đã đạt đƣợc một số kết quả khả quan. Tuy nhiên, kể từ sau năm 2000, hƣớng tiếp cận sử dụng vi ảnh hai chiều hoặc ba chiều cho xác định chức năng protein nhận đƣợc nhiều quan tâm từ các nhà nghiên cứu. Nhận xét rằng, giải quyết các vấn đề công nghệ trên thông qua phân tích dữ liệu ảnh không thể tách rời nhu cầu cần “làm rõ” hay “nhìn thấy” và đặc biệt là “hiểu” các đối tượng trong ảnh. Nhu cầu trên gắn liền với việc nghiên cứu, xây dựng các phép biến đổi và thực hiện các phân tích trên các hệ số biến đổi thay vì xử lý trực tiếp trên dữ liệu ảnh thô. Các ứng dụng có thể như: xác định tính chất bề mặt; trích đặc trưng; nâng cao chất lượng ảnh; khử nhiễu, v.v. Đây chính là định hướng cho chúng tôi thực hiện luận án này. Chúng tôi không nhằm nghiên cứu các vấn đề thuộc lĩnh vực khoa học và công nghệ nano, mà hƣớng đến các phương pháp sử dụng toán học, thống kê và khoa học máy tính xử lý, phân tích dữ liệu có được từ các tiến bộ của công nghệ tạo vi ảnh. 1.2. Tình hình nghiên cứu trong và ngoài nƣớc Ở trong nước, xét trên khía cạnh công nghệ và sản xuất, việc nghiên cứu và ứng dụng CNTT vào một số công đoạn của quy trình sản xuất mạch tích hợp còn khá hạn chế. 15 Một số ít công ty nhƣ Global CyberSoft, SiGlaz, v.v.. đã tham gia vào lĩnh vực này nhƣng hầu hết chỉ giới hạn ở mức gia công phần mềm. Mục tiêu của các sản phẩm này là chẩn đoán lỗi trong quá trình sản xuất vi mạch. Cụ thể hơn, dữ liệu đƣợc lấy trực tiếp từ dây chuyền sản xuất hay vi ảnh và đƣợc phân tích. Một số nghiên cứu và phát triển có tiếp cận logic mờ để phân lớp lỗi. Một trong những kết quả chính của SiGlaz là sản phẩm IDA-Intelligence defect Analysis (tham khảo www.siglaz.com) . Sản phẩm này hỗ trợ trong dây chuyển sản xuất mạch bán dẫn. Dữ liệu lấy trực tiếp từ định dạng KLARF. Các giải pháp đƣợc sử dụng chủ yếu để phát hiện lỗi dựa trên phân loại các đặc trƣng trích rút trực tiếp trên dữ liệu. Theo tìm hiểu của chúng tôi, cách tiếp cận phân lớp lỗi của sản phẩm này dựa trên thuật giải k-NN. Việc xác định vi lỗi chỉ trên một số hƣớng cụ thể (nhƣ 0, 45, 90 độ). Ƣu thế của giải pháp này là ít tính toán và đáp ứng phần nào nhu cầu sản xuất công nghiệp. Sản phẩm thứ hai đƣợc nghiên cứu và phát triển trong nƣớc là FabSolve của công ty công nghệ Dolsoft, nhƣng đã đƣợc chuyển giao cho tập đoàn KLA-Tencor từ cuối những năm 2007. Mục tiêu của sản phẩm này là nhằm phục vụ trong công nghệ sản xuất vi mạch bán dẫn. Định hƣớng sản phẩm là tìm ra những lỗi hay những khác biệt nếu có giữa quá trình sản xuất wafer và bản thiết kế các vi mạch ban đầu đƣợc dự kiến sản xuất. Giải pháp là so sánh vi ảnh (bề mặt các khu vực hay toàn bộ các lớp phủ vật chất trên wafer) với bản thiết kế (tập tin định dạng GDSII- tham khảo trong hoặc Lỗi của wafer, hay của những con chip luôn có tỷ lệ rất cao vì quy trình quá tinh vi, phức tạp. Bài toán chính là thực hiện so khớp giữa một ảnh khu vực và bản thiết kế vô cùng lớn (kích thƣớc tập tin GDS có khi lên đến vài chục gigabyte). Ƣu điểm của phần mềm này là xử lý nhanh dữ liệu hình ảnh con chip trong quá trình chế tạo, đem so sánh tức thì với “bản đồ chip” theo thiết kế để xác định các khiếm khuyết của chip và phát lệnh hiệu chỉnh kịp thời sửa sai cho dây chuyền công nghệ. 16 Xét trên khía cạnh khai thác các công cụ toán học để giải quyết các bài toán CNTT, trƣờng ĐH KHTN TPHCM cũng đã có một số công trình sử dụng biến đổi wavelet, Radon cho các bài toán truy vấn hay xử lý ảnh. Luận án tiến sĩ của tác giả Nguyễn Đình Thúc (ĐH KHTN, ĐHQG. TPHCM) đã trình bày các cải tiến cũng nhƣ khai thác biến đổi Radon và ứng dụng. Tuy nhiên nhƣ chúng tôi đã nhận xét trong phần giới thiệu, việc khai thác thông tin ở các tỉ lệ khác nhau là cần thiết. Đối với yêu cầu này thì biến đổi Radon chƣa đáp ứng đầy đủ. Ngành công nghệ sinh học, gần đây đã đƣợc sự quan tâm nhiều từ cấp lãnh đạo cho đến các nhà khoa học. Phòng thí nghiêm tế bào gốc cũng đã đƣợc quyết định thành lập. Đây là tiền đề cho các nghiên cứu sâu hơn trong lĩnh vực công nghệ sinh học (CNSH). Ở đây, công cụ CNTT phục vụ cho nghiên cứu trong CNSH là thực sự cần thiết. Theo xu hƣớng này, các công trình nghiên cứu của nhóm tác giả Đỗ Phúc thuộc ĐH CNTT, ĐHQG TP.HCM đã khai thác tri thức dựa trên CSDL gen và đạt đƣợc một số thành công nhất định. Các công trình này sử dụng ngân hàng gen một chiều nhằm giải quyết các bài toán nhƣ xử lý, phân tích, nhận dạng gen hỗ trợ đào tạo và nghiên cứu trong ngành công nghệ sinh học. Tuy nhiên, các nghiên cứu này không dựa trên dữ liệu vi ảnh. Nhu cầu cấp thiết đặt ra là xây dựng các công cụ trợ giúp giải quyết các bài toán trong sinh học là phân tích dữ liệu ảnh. Các nhu cầu sử dụng CNTT từ đơn giản nhất nhƣ đếm các số lƣợng tế bào trong quá trình phân bào trên ảnh hay video cho đến phức tạp hơn nhƣ xác định hình dáng là rất cần thiết. Chúng tôi nhận thấy rằng, việc ứng dụng CNTT, đặc biệt là sử dụng dữ liệu ảnh hỗ trợ giải quyết các vấn đề trong CNSH còn hạn chế ở nƣớc ta. Ở ngoài nước, từ những năm 2000 các nghiên cứu trong lĩnh vực tin sinh học (bioinformatics) và sử dụng CNTT trong công nghệ bán dẫn phát triển rất mạnh, trong đó có khá nhiều nghiên cứu sử dụng CNTT trong bài toán tìm hiểu tính chất protein. Một tiếp cận phổ biến là hƣớng đến phân tích vị trí bào quan của protein 17 với mục tiêu chính là xác định đƣợc các sơ đồ định vị protein (protein location pattern). Yêu cầu đặt ra là dự đoán hay xác định đƣợc các sơ đồ vị trí của các protein, và xây dựng đƣợc tập chứa các sơ đồ vị trí có thể của protein. Theo định hƣớng của bài toán dự đoán protein, nhóm tác giả Harris (tham khảo 81407) vào năm 2004 đã trình bày mô hình dự đoán sơ đồ vị trí của các protein dựa trên ontology các thành phần tế bào thuộc dự án Gene Ontology (www.geneontology.org). Nhóm tác giả đã sử dụng đồ thị có hƣớng (Directed Acyclic Graph-DAG), trong đó mô tả sơ đồ định vị các thành phần tế bào. Tuy nhiên, do bản chất của DAG với một nút con có thể có nhiều nút cha, vì vậy có thể dẫn đến suy diễn sai trên đồ thị trong quá trình dự đoán. Theo định hƣớng xác định sơ đồ định vị các thành phần tế bào, nhóm tác giả Lujan thuộc đại học Castilla-La Mancha, Albacete, Tây Ban Nha đã trình bày trong bài viết “Electron Microsopy Studies of Receptor Localization” phƣơng pháp sử dụng vi ảnh từ kính hiển vi điện tử để xác định sơ đồ định vị thụ thể (receptor). Tuy nhiên kỹ thuật này không thể làm việc với tế bào sống, vì vậy việc sử dụng vi ảnh huỳnh quang (fluorescence microscopy image) trở thành giải pháp phổ biến nhất trong bài toán nghiên cứu tính chất protein. Nổi bật theo định hƣớng sử dụng vi ảnh huỳnh quang là các công trình phân loại tính chất protein của nhóm tác giả M R. F. Murphy thuộc Đại học Carinegie Mellon, Pittsburgh, PA, USA [55]. Đây đƣợc xem là công trình tiên phong trong việc sử dụng vi ảnh định vị protein trong bào quan để khai thác tri thức protein trong CNSH. Cách giải quyết dựa trên mạng nơ-ron với tập đặc trƣng trích từ vi ảnh huỳnh quang. Đối với bài toán nhận dạng, bản chất vấn đề là xây dựng đƣợc tập đặc trƣng và phát triển mô hình phân lớp thích hợp. Trong công trình này, các tác giả đã xây dựng tập đặc trƣng dựa trên một số khái niệm cơ bản trong xử lý ảnh nhƣ: mật độ, số Euler, phƣơng sai, tỉ lệ về kích thƣớc giữa các “đối tƣợng”, tính đồng nhất, bao lồi, wavelet; và các tính chất lấy đƣợc từ vi ảnh huỳnh quang nhƣ: tâm (COF), 18 khoảng cách trung bình của các đối tƣợng đến COF, v.v.. và sử dụng mạng nơ-ron để dự đoán. Các đặc trƣng đƣợc nhóm tác giả gọi là các bộ SLF (Subcellular Location Features – các đặc trƣng định vị bào quan). Kết quả thực nghiệm phân lớp trên tập ảnh mẫu chụp tế bào Hela và CHO đƣợc nhóm tác giả công bố khoảng 90%. Nhận xét rằng, tập đặc trƣng biểu diễn ảnh trong các công trình và sản phẩm trên dựa trên tri thức chuyên gia và các khái niệm đã đƣợc trình bày trong các bài viết về đặc trƣng vân (texture) hay mẫu tô (pattern). Nghĩa là, thực hiện trích rút thông tin trực tiếp trên ảnh gốc, sau đó, xây dựng mô hình phân lớp (dựa trên logic mờ, mạng nơ-ron hay SVM) trên tập đặc trƣng đã chọn để phân tích. Trong lĩnh vực phân tích lỗi vi ảnh chụp wafer trong quá trình sản xuất vi mạch, vào năm 2000 nhóm tác giả Thomas P. Karnowski, Kenneth W. Tobin, Shaun S. Geason thuộc phòng thí nghiệm quốc gia OakRidge đã nghiên cứu, và công bố kết quả trong các bài viết “Fuzzy Logic Connectivity in Semiconductor Defect Clustering', và „Feature Analisys and Classfication of Manufacturing Signatures Based on Semiconductor Wafermaps (nguồn đồng thời thực hiện thành công sản phẩm hỗ trợ trong dây chuyền sản xuất vi mạch. Giải pháp dựa trên vi ảnh xám đƣợc chuyển trực tiếp từ dữ liệu định dạng KLARF, và sử dụng k-NN hay logic mờ để phân loại lỗi. Nhu cầu này đã đƣợc các đơn vị trong nƣớc giải quyết thành công phần nào nhƣ đã trình bày ở phần „Tình hình nghiên cứu trong nước‟. Ở khía cạnh biểu diễn ảnh dựa trên các biến đổi giải tích, hầu hết các nghiên cứu đều tập trung vào biến đổi Fourier, wavelet. Nhiều công trình [31], [35] đã phân tích các ƣu điểm và nhƣợc điểm của các phép biến đổi trên. Cụ thể là biến đổi Fourier chỉ biểu diễn thông tin tần số, trong khi biến đổi wavelet hai chiều có thể biểu diễn thông tin tần số và vị trí và vì vậy chỉ thích hợp để khai thác dữ liệu dạng điểm ở các tỉ lệ khác nhau (đƣợc trình bày chi tiết trong chƣơng 4). Vì vậy, một số 19 nghiên cứu gần đây tập trung tìm kiếm các biến đổi sao cho có thể “biểu diễn” được các đối tượng cong trong ảnh. Trong luận án này, ngoài việc nghiên cứu và đề xuất các mô hình biểu diễn ảnh thông qua các hệ số thưa và các mô hình phân lớp, chúng tôi mong muốn bước đầu giải quyết một số vấn đề trong các ngành công nghệ mũi nhọn trên. 1.3. Mục tiêu thực hiện của luận án Trong những năm 80 của thế kỷ trƣớc, biến đổi wavelet đƣợc giới thiệu nhƣ sự cải tiến của biến đổi Fourier và ngày càng đƣợc ứng dụng rộng rãi trong nhiều lĩnh vực. Lý do chính là dữ liệu biến đổi wavelet biểu diễn đƣợc thông tin trong cả miền tần số và không gian (trong khi biến đổi Fourier chỉ thể hiện trong miền tần số) nhờ vào xây dựng thông tin tần số xuất hiện ở các tỉ lệ và vị trí khác nhau. Trong xử lý ảnh, khái niệm đa phân giải đóng góp rất nhiều vào các kỹ thuật phân rã hay phân tích ảnh nhƣ wavelet, laplacian pyramid. Nhận xét là các thông tin ảnh xuất hiện ở một số tỉ lệ nhất định là khác nhau. Nhận xét này có thể quan sát đƣợc ở lĩnh vực bản đồ, trong đó một số chi tiết chỉ xuất hiện ở tỉ lệ nhỏ, nhƣng không xuất hiện ở tỉ lệ lớn và ngƣợc lại. Áp dụng ý tƣởng này trong ảnh sinh học, chúng ta có thể khai thác và phân tích thông tin ở mức độ phân tử hay tế bào. Từ nhận xét trên, ta thấy kỹ thuật đa phân giải rất thích hợp trong các bài toán phân tích vi ảnh sinh học hay trong ngành bán dẫn nhằm thực hiện các chẩn đoán, nhận dạng và các bài toán xử lý ảnh cổ điển nhƣ khử nhiễu, tái tạo và nén ảnh. Đặc biệt phƣơng pháp dựa trên biến đổi đa phân giải tỏ ra rất thích hợp khi chất lƣợng ảnh không tốt. Việc dùng các phƣơng pháp xử lý ảnh truyền thống để giải quyết vấn đề “làm rõ” đối tƣợng trong vi ảnh gặp một số nhƣợc điểm khó khắc phục nhƣ đƣợc trình bày ở các chƣơng sau. Cụ thể hơn, giải quyết vấn đề xác định biên dựa trên các phƣơng pháp sử dụng Canny, Robert, Sobel, v.v đều không đạt với vi ảnh nhiễu. 20 Tƣơng tự, với yêu cầu phân đoạn ảnh, các phƣơng pháp gom nhóm (cluster) hay loang vùng (region growing) đều không thực hiện đƣợc trên các tập vi ảnh nhƣ sẽ đƣợc trình bày trong chƣơng 3. Biến đổi wavelet là sự lựa chọn phổ biến để giải quyết nhiều vấn đề trong xử lý ảnh. Tuy vậy, biến đổi wavelet cũng thể hiện các hạn chế khi phân tích các đặc điểm cong tồn tại phổ biến trong ảnh. Nguyên nhân là vì các hệ số của biến đổi wavelet hai chiều chỉ chứa thông tin vị trí ở các tỉ lệ khác nhau, và hoàn toàn không có thông tin biểu diễn hƣớng hay góc. Từ những nhận xét trên, chúng tôi thấy rằng việc nghiên cứu và phát triển các biến đổi biểu diễn đặc trưng cong ở nhiều tỉ lệ sẽ giúp“dễ dàng nhìn thấy các đối tượng cong” trên ảnh với số lượng hệ số tối thiểu sẽ mang lại nhiều ưu điểm khi phân tích dữ liệu. Ngoài ra, việc khai thác các mô hình thống kê áp dụng trên ảnh sẽ mang lại các cải tiến trong lĩnh vực tiền xử lý, phân tích hay nhận dạng ảnh. Chúng tôi cũng nghiên cứu các phương pháp dựa trên các biến đổi toán học làm nền tảng cho hệ thống các ứng dụng phân tích vi ảnh từ giai đoạn xác định biên, phân đoạn lẫn tạo ra tập đặc trưng cho quá trình phân tích. Luận án tập trung nghiên cứu, xây dựng các mô hình và công cụ toán học hỗ trợ phân tích vi ảnh với các mục tiêu sau: Mục tiêu tổng quát  Nghiên cứu các biến đổi đa tỉ lệ có hƣớng nhằm xây dựng đƣợc tập hệ số thƣa có thể biểu diễn ảnh.  Xây dựng mô hình nhận dạng thích hợp dùng các hệ số thƣa của các biến đổi có hƣớng.  Sử dụng tập các hệ số thƣa của các biến đổi nhằm giải quyết các bài toán cơ bản trong xử lý ảnh nhƣ xác định biên, phân đoạn. 21 Mục tiêu cụ thể  Xây dựng các mô hình xác định biên dựa trên biến đổi wavelet với hàm phức, bảo toàn kích thƣớc mẫu, và ứng dụng làm rõ biên vùng tròn trong ảnh DNA microarray.  Nghiên cứu, cải tiến mô hình trƣờng ngẫu nhiên Markov, và ứng dụng vào bài toán phân đoạn vi ảnh.  Nghiên cứu và vận dụng biến đổi đa phân giải có hƣớng cục bộ vào bài toán phân tích vi ảnh.  Đề xuất mô hình nhận dạng đối tƣợng trong vi ảnh dựa trên các đặc trƣng giải tích và ứng dụng vào phân tích tính chất protein. 1.4. Những đóng góp chính Luận án nghiên cứu và xây dựng một số phƣơng pháp dựa trên công cụ toán học và ứng dụng vào các công đoạn tiền xử lý và phân tích vi ảnh. Các đóng góp chính bao gồm: 1. Đề xuất phƣơng pháp xác định biên dựa trên cực trị wavelet với hàm phức và bảo toàn kích thƣớc mẫu. Xây dựng một số mô hình xác định biên dựa trên ƣu điểm của các thuật giải a trous UWT và IUWT nhằm cải tiến chất lƣợng biên cũng nhƣ tốc độ thực hiện [CT.2]. 2. Nghiên cứu và vận dụng trƣờng ngẫu nhiên Markov với các cải tiến về tốc độ hội tụ cho bài toán phân đoạn ảnh [CT.4]. Cũng nhƣ các phƣơng pháp ngẫu nhiên khác (thuật giải genetic, mạng nơ-ron), tốc độ hội tụ và chất lƣợng lời giải tối ƣu phụ thuộc vào lời giải khởi đầu và phƣơng pháp cập nhật lời giải. Chúng tôi đề xuất sử dụng thuật giải nung luyện mô phỏng cho quá trình Markov với hai đóng góp chính: 22 o Xác định nhiệt độ khởi đầu cho thuật giải nung luyện mô phỏng (Simulated Annealing-SA). o Công thức giảm nhiệt độ thích nghi bảo đảm cho thuật giải phân đoạn ảnh hội tụ đến lời giải tối ƣu. Bên cạnh đó, chúng tôi đề xuất các lƣợc đồ phân đoạn ảnh phân cấp dựa trên các kết hợp biến đổi Laplacian Pyramid (LP), wavelet, a trous wavelet với trƣờng ngẫu nhiên Markov (MRF) và đặc biệt là phân đoạn ảnh kết hợp giữa MRF và wavelet bất đẳng hƣớng trên hai dạng giảm hay giữ nguyên kích thƣớc mẫu nhằm cải tiến tốc độ cũng nhƣ chất lƣợng lời giải tối ƣu. Với bài toán cụ thể nhƣ phân đoạn ảnh chụp wafer bán dẫn, chúng tôi đề xuất sử dụng thuật giải „đƣờng thủy phân‟ (watershed) với các cải tiến kết hợp giữa thông tin topo và cƣờng độ xám của các điểm ảnh trong xác định biên, và khử phân đoạn quá nát [CT.3], [CT.7]. 3. Đề xuất hai phép biến đổi tựa curvelet dựa trên kết hợp giữa ridgelet hữu hạn và phân rã LP hay wavelet packet. Ƣu điểm của các biến đổi đề xuất là giảm số lƣợng hệ số thƣa trong khi vẫn bảo toàn các tính chất của biến đổi có hƣớng cục bộ [CT.1], [CT.6]. 4. Xây dựng tập các đặc trƣng bất đẳng hƣớng dựa trên các biến đổi đa phân giải có hƣớng cục bộ và làm đầu vào cho các hệ nhận dạng [CT.5]. o Sử dụng các hệ số của các biến đổi có hƣớng cục bộ. o Sử dụng hệ số của đa thức Zernike trên các vành tròn của các biến đổi tựa curvelet nhằm biểu diễn hình dáng của phần ảnh trên các vành tròn. Kết hợp giữa đặc trƣng đa phân giải và SVM phân cấp nhằm cải tiến tốc độ nhận dạng. Ứng dụng các nghiên cứu vào phân tích thông tin vi ảnh định vị protein trong bào quan nhằm dự đoán chức năng protein. 23 1.5. Cấu trúc luận án Chƣơng 1 giới thiệu nhu cầu, mục tiêu nghiên cứu của luận án. Trình bày các đóng góp, cũng nhƣ cấu trúc của luận án. Chƣơng 2 trình bày thuật giải xác định biên dựa trên biến đổi wavelet. Phần đầu trình bày tóm tắt biến đổi wavelet liên tục và rời rạc trong không gian một hoặc hai chiều. Phần kế tiếp trình bày thuật giải a trous cho biến đổi wavelet không giảm kích thƣớc mẫu. Phần kế tiếp trình bày phƣơng pháp xác định cực trị mô-đun của biến đổi wavelet theo các thuật giải wavelet gốc hoặc a trous dựa trên hàm wavelet thực hoặc phức. Sau cùng là ứng dụng cực trị wavelet để xác định biên các vùng tròn trong vi ảnh microarray sử dụng phân tích phổ gen. Đồng thời các thực nghiệm cũng đƣợc thực hiện trên ảnh y khoa. Cuối cùng là thực nghiệm so sánh giữa giải pháp đƣợc đề xuất trong luận án với các phƣơng pháp xác định biên cổ điển nhƣ Canny, Robert, và Sobel. Chƣơng 3 trình bày hai phƣơng pháp phân đoạn ảnh. Phƣơng pháp thứ nhất dựa trên thuật giải watershed cải tiến kết hợp giữa độ đo khoảng cách và giá trị cƣờng độ xám của từng điểm ảnh, đồng thời đề nghị thuật giải làm giảm tình trạng phân đoạn quá nát dựa trên thông tin vector topo kết hợp với cƣờng độ mức xám. Phƣơng pháp thứ hai dựa trên thống kê sử dụng mô hình trƣờng ngẫu nhiên Markov với thuật giải nung luyện mô phỏng có hàm giảm nhiệt độ thích nghi. Thuật giải SA cải tiến với phƣơng pháp tính nhiệt độ khởi đầu và hàm giảm nhiệt độ thích nghi và ứng dụng chúng vào phân đoạn ảnh. Sau cùng là các phƣơng pháp phân đoạn ảnh dựa trên MRF phân cấp với các dạng phân rã giảm hay giữ nguyên kích thƣớc mẫu. Chƣơng 4 trình bày các phép biến đổi đa phân giải cục bộ có hƣớng. Phần đầu tóm tắt biến đổi ridgelet liên tục và các dạng rời rạc dựa trên sự kết hợp giữa biến đổi Radon và wavelet một chiều trên các lát cắt chiếu trong miền Radon. Sơ lƣợc các phƣơng pháp rời rạc hoá biến đổi ridgelet nhƣ rectopolar và slantstack nhằm tạo lƣới phủ, cũng nhƣ biến đổi ridgelet trực giao. Phần kế tiếp trình bày hai dạng biến đổi đa phân giải cục bộ có hƣớng curvelet và contourlet và ứng dụng của chúng để 24 biểu diễn “đối tƣợng cong” trong ảnh. Xây dựng các mô hình kết hợp giữa ridgelet hữu hạn và các phân rã LP hay wavelet nhằm tạo ra các biến đổi tựa curvelet. Phần cuối của chƣơng minh hoạ ƣu điểm của các hệ số của các phép biến đổi tựa curvelet thông qua thực nghiệm tái tạo lại ảnh gốc. Chƣơng 5 trình bày phƣơng pháp phân tích vi ảnh dƣạ trên sự kết hợp giữa SVM cải tiến và các đặc trƣng đa phân giải với các hệ số của biến đổi trong chƣơng 4. Phƣơng pháp xây dựng đặc trƣng bất biến với tịnh tiến, tỉ lệ, quay. Trình bày phƣơng pháp trích đặc trƣng Haralick và Zernike moment. Phƣơng pháp xây dựng đặc trƣng Zernike moment kết hợp biến đổi tựa curvelet nhằm xây dựng các đặc trƣng Zernike trên các vành tròn chứa các hệ số tựa curvelet. Trình bày phƣơng pháp giữ lại đặc trƣng có nghĩa dựa trên ma trận các giá trị riêng (eigen). Sau cùng là kết quả thực nghiệm thể hiện độ chính xác khi phân loại thực hiện trên tập ảnh chụp tế bào HELA, CHO, v.v. Chƣơng 6 trình bày kết luận và định hƣớng phát triển, và sau cùng là danh sách tài liệu tham khảo.

Các file đính kèm theo tài liệu này:

  • pdf5.pdf
  • pdf0.pdf
  • pdf1.pdf
  • pdf10.pdf
  • pdf11.pdf
  • pdf12.pdf
  • pdf13.pdf
  • pdf2.pdf
  • pdf3.pdf
  • pdf4.pdf
  • pdf6.pdf
  • pdf7.pdf
  • pdf8.pdf
  • pdf9.pdf
Luận văn liên quan