Chương trình Tô mỳ Minh duy

Giải quyết hiệu quả vấn đề trong những mối quan hệ

Đại Việt Ngữ

1.  Tìm 751’000 câu, 16 triệu từ song ngữ Anh – Việt

-TH0001:   Đây không phải truyện hệ mà là một khái niệm tệp dữ liệu song ngữ.

Tệp dữ liệu song ngữ là một tệp có định dạng .xml

Đây có thể xem là một dạng từ điển nhưng không phải 1 từ Anh – 1 từ Việt mà là 1 câu Anh – 1 câu Việt.

Ví dụ:
xem TH001D

-TH001A:   Với vai trò một Nhà phát triển Đại Việt Ngữ, tôi muốn
có chức năng chọn lọc các cặp câu song ngữ Anh Việt giữa hai

phụ đề một tiếng Anh và một tiếng Việt.

Khi tôi đưa ra hai tệp phụ đề, chức năng chọn lọc này phải tự động ghép các cặp câu song ngữ tương ứng theo thời
gian ra tệp dữ liệu song ngữ,rồi nó phải cho phép tôi tìm kiếm, bổ sung, biên soạn lại từng cặp câu này.

-TH001B:   đây không phải truyện hệ mà là ví dụ một tệp phụ đề tiếng Anh
“englishsub.srt” mở bằng notepad

1

00:02:01,199 –> 00:02:02,199

<font color=yellow><i>Subtitle by</font></i>

<font color=Red><b>Aldi Arman</font></b>

2

00:02:02,200 –> 00:02:03,997

Oh, come on.

3

00:02:09,000 –> 00:02:10,319

What now?

-TH001C:    đây không phải truyện hệ mà là ví dụ một tệp phụ đề tiếng Việt “vietsub.srt” mở bằng notepad

1

00:00:25,000 –> 00:00:30,000

<font color=Yellow><i>Subtitle by</font></i>

Đặng T.Kiên – YH: ao_long57@yahoo.com

<font
color=Red><b>Dịch từ sub Eng của Aldi Arman</font></b>

2

00:02:02,200 –> 00:02:03,997

Ồ, thôi nào.

3

00:02:09,000 –> 00:02:10,319

Gì nữa đây?

-TH001D:   Đây không phải truyện hệ mà là ví dụ cho việc ghép cặp tương ứng của 1

cặp câu song ngữ trong 2 tệp phụ đề như TH001B, TH001C

sau khi chạy chức năng ở TH001A ta có tệp “result.xml” có nội dung sau:

….

<Sentence ID=”1″>

<ENG>Oh, come on</ENG>

<VIE>Ồ, thôi nào</VIE>

</Sentence>

….

-TH002A:   Với vai trò một Nhà phát triển Đại Việt Ngữ, tôi muốn
có chức năng lấy đường đẫn của phim

Khi tôi đưa vào một địa chỉ web như http://subscene.com, chức
năng này phải tự động tìm tất cả các phim có phụ đề tiếng Việt sau đó
lưu vào tệp kết quả có dạng xml như TH002B

-TH002B: đây không phải là truyện hệ mà là ví dụ một tệp chứa đường dẫn của phim “result.xml”

….

<FILM ID=”1″>http://subscene.com/Season-of-the-Witch/subtitles-86380.aspx</FILM&gt;

….

-TH003A:    Với vai trò một Nhà phát triển Đại Việt Ngữ, tôi muốn
có chức năng tải phụ đề từ một địa chỉ web như TH003B về máy

Khi tôi đưa vào một địa chỉ web như TH003B, chức
năng này phải tự động tải tất cả phụ đề tiếng Anh và tiếng Việt về máy, rồi nó
phải cho phép tôi tìm kiếm, phân biệt, biên soạn các tệp phụ đề đã tải về.

-TH003B: đây không phải là truyện hệ mà là ví dụ một địa chỉ, web có chứa phụ đề cho một phim

http://subscene.com/Season-of-the-Witch/subtitles-86380.aspx

-TH004:   Với vai trò người phát triển đại việt ngữ, tôi muốn
ghép các chức năng của TH001-TH002-TH003 thành một chương trình

chương trình cho phép nhập vào địa chỉ web http://subscene.com/,

khi gõ lệnh hoặc nhấn nút sẽ thực hiện chức năng TH002 cho ra tệp
“linkfilm.xml”,

khi gõ lệnh hoặc nhấn nút sẽ thực hiện chức năng TH003 lưu kết quả

về một thư mục “subscenne”,

khi gõ lệnh hoặc nhấn nút sẽ thực hiện chức năng TH001 cho ra tệp
“DataSubEV.xml”,

ngoài ra chương trình cần có khả năng tích hợp để có thể lấy dữ liệ từ

các trang web khác ngoài trang “http://subscene.com/&#8221;

Advertisements

About erick84khai

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

Information

This entry was posted on 27-03-2011 by in Minh Duy.
%d bloggers like this: