Trong kỷ nguyên công nghiệp tinh tế, Vương Chính Dương dẫn Tần Nghị đi sâu vào bên trong viện nghiên cứu. Khi nhắc đến các nội dung liên quan đến hệ điều hành Hán ngữ và ngôn ngữ lập trình Hán ngữ, lông mày anh ta đã nhíu chặt thành hình chữ "Xuyên" (川).
"Hệ điều hành Hán ngữ và lập trình Hán ngữ tuy là một đề tài mang tính học thuật, trước đây cũng có rất nhiều tiền bối nghiên cứu qua, nhưng cho đến nay chúng ta vẫn chưa đạt được bất kỳ tiến triển nào. Cậu cũng không cần quá mức sốt ruột, hãy bình tĩnh sắp xếp lại tư duy, phương pháp giải quyết luôn nhiều hơn khó khăn."
Tần Nghị mỉm cười an ủi.
Lập trình Hán ngữ và hệ điều hành Hán ngữ không phải là những khái niệm mới mẻ. Ngay từ khi máy tính bắt đầu du nhập vào quốc gia chúng ta, đã có những người bắt tay vào nghiên cứu lĩnh vực này.
Nguyên nhân rất đơn giản, bởi vì Hán ngữ là tiếng mẹ đẻ của chúng ta. Dù là trong sinh hoạt hằng ngày hay công tác giao dịch, chúng ta đều sử dụng Hán ngữ, trong khi các lĩnh vực liên quan đến máy tính hầu như đều gắn liền với tiếng Anh, từ nền tảng cơ sở cho đến cấu trúc hệ thống đều được xây dựng trên ngôn ngữ này.
Điều này gây ra nhiều bất lợi cho sự phát triển của kỹ thuật máy tính và ngành công nghiệp internet nước nhà. Nếu có thể sử dụng Hán ngữ để lập trình, xây dựng nên một hệ điều hành bằng Hán ngữ, chắc chắn sẽ hỗ trợ rất lớn cho sự phát triển của ngành công nghệ thông tin quốc gia.
Tuy nhiên, quá trình nghiên cứu lập trình Hán ngữ và hệ điều hành Hán ngữ có thể nói là gập ghềnh muôn lối, vô cùng gian khổ.
Ngay từ giai đoạn đầu, chỉ riêng việc nghiên cứu một bộ gõ tiếng Hán, quốc gia đã phải triệu tập rất nhiều nhân viên nghiên cứu và các nhà khoa học để tập trung phân tích.
Bởi vì Hán ngữ và tiếng Anh thuộc hai hệ ngôn ngữ hoàn toàn khác biệt, sự khác biệt giữa chúng là quá lớn.
Hán ngữ thuộc hệ ngôn ngữ đơn lập, phát triển từ chữ tượng hình sơ khai; trong khi tiếng Anh thuộc hệ ngôn ngữ Ấn-Âu, được cấu thành từ 26 chữ cái Latinh.
Chính vì sự khác biệt to lớn giữa hai loại ngôn ngữ này, khi máy tính và internet mới du nhập vào nước ta, tốc độ nhập liệu tiếng Hán trên máy tính cực kỳ chậm, thậm chí phải dựa vào chữ cái Latinh để hỗ trợ nhập liệu.
Sau đó, nhờ sự nghiên cứu miệt mài của các nhà khoa học và kỹ sư, bộ gõ Ngũ Bút ra đời, giúp tốc độ nhập liệu tiếng Hán tăng vọt. Về sau, khi ngày càng nhiều người tham gia nghiên cứu, các loại bộ gõ thông minh lần lượt xuất hiện, vấn đề nhập liệu Hán ngữ đã được giải quyết triệt để.
Thế nhưng, trong nghiên cứu về lập trình Hán ngữ và hệ điều hành Hán ngữ, cho đến nay vẫn chưa có bất kỳ đột phá mang tính thực chất nào. Hiện tại, các phần mềm lập trình chủ lưu và phổ biến nhất trên toàn cầu đều là phần mềm tiếng Anh.
Về phần hệ điều hành, đó càng là thế giới của tiếng Anh. Dù là hệ điều hành Windows của Microsoft hay hệ điều hành của Apple, tất cả đều là những hệ điều hành dựa trên nền tảng tiếng Anh.
Đầu tư không ít, nhân lực nghiên cứu cũng rất nhiều, nhưng vẫn không có tiến triển thực chất, dẫn đến việc một số người thậm chí đổ lỗi lên đầu Hán ngữ.
Họ cho rằng Hán ngữ là loại ngôn ngữ lạc hậu, không thể thích ứng với xu thế phát triển của thời đại, quốc gia nên toàn diện đào thải Hán ngữ, học tập Ấn Độ chuyển sang dùng tiếng Anh để có thể hội nhập quốc tế và bắt kịp xu thế phát triển.
Tất nhiên, những luận điệu vô lý kiểu tự hạ thấp mình để nâng cao người khác cuối cùng đều tự sụp đổ. Theo sự xuất hiện của điện thoại thông minh, mọi người đột nhiên phát hiện ra rằng, khi nhập liệu trên thiết bị di động, Hán ngữ chỉ cần bàn phím chín phím là đủ, tốc độ rất nhanh, trong khi nhập liệu tiếng Anh lại rất chậm và cực kỳ dễ sai sót.
Đến mức khi nhập liệu tiếng Anh, mọi người lại dần có xu hướng học theo cách của Hán ngữ, sử dụng những phương thức ngắn gọn hơn để biểu đạt ý nghĩa.
"Tôi cũng không quá vội, chỉ là tiến độ trì trệ kéo dài khiến bản thân cảm thấy rất bứt rứt."
Nghe lời an ủi của Tần Nghị, Vương Chính Dương khẽ cười khổ.
Có thể gia nhập Viện nghiên cứu của Tập đoàn Khoa học Kỹ thuật Ngân Hà, đãi ngộ và lương bổng của anh ta rất tốt, cuộc sống sung túc không chút lo âu, về mặt đời sống cá nhân không có gì phải phiền lòng.
Thế nhưng trong công việc, việc nghiên cứu lập trình Hán ngữ và hệ điều hành Hán ngữ lâu ngày không có kết quả khiến anh ta vô cùng bực bội, thậm chí từng có ý định từ chức.
"Nói cho tôi nghe xem, lập trình Hán ngữ và hệ điều hành Hán ngữ đang gặp phải những vấn đề cụ thể nào?"
Tần Nghị mỉm cười. Thực tế, về phương diện nghiên cứu lập trình và hệ điều hành Hán ngữ, Tần Nghị cũng biết một chút, bản thân anh cũng từng nghiêm túc học tập và nghiên cứu qua.
Trong Tháp Khoa học Kỹ thuật, Tần Nghị đã cẩn thận nghiên cứu ngôn ngữ và văn tự của rất nhiều nền văn minh trong vũ trụ, tìm ra không ít loại ngôn ngữ có cấu trúc tương đồng với Hán ngữ, từ đó nghiên cứu sâu về hệ điều hành máy tính và hệ thống lập trình của họ.
Tháp Khoa học Kỹ thuật là thành quả của một nền văn minh cao cấp, đối với những hệ thống ngôn ngữ và văn tự chưa được giải mã, hay các phương thức lập trình, nó đều cung cấp những tài liệu hướng dẫn chi tiết. Từ cách thức khởi tạo văn tự cho đến việc sắp xếp tư duy logic đều có những chỉ dẫn cụ thể.
Lần này đến đây, Tần Nghị dự định truyền thụ lại những phương pháp và tư duy đó cho mọi người. Nếu không, e rằng đến khi hệ thống thực tế ảo được nghiên cứu thành công, thì hệ thống vận hành và hệ thống lập trình bằng tiếng Hán vẫn chưa thể hình thành.
"Nên bắt đầu từ đâu đây?"
Vương Chính Dương dẫn Tần Nghị đi vào một phòng họp bên trong viện nghiên cứu. Nơi đây đã chật kín những chuyên gia đang phụ trách dự án phát triển ngôn ngữ lập trình và hệ điều hành bằng tiếng Hán.
Vương Chính Dương cẩn thận cân nhắc câu chữ rồi lên tiếng: "Trước tiên hãy nói về ngôn ngữ. So với tiếng Anh, tiếng Hán có rất nhiều ưu thế."
"Văn tự tiếng Hán tinh luyện, lời ít ý nhiều, độ dư thừa thông tin thấp, dùng số lượng ký tự ít nhất để biểu đạt hàm nghĩa phong phú nhất. Xét dưới góc độ lý thuyết thông tin, nếu coi chữ Hán và chữ cái Latinh là đơn vị cơ bản để cấu thành từ ngữ, câu văn, truyền tải thông tin, thì làm thế nào để đo lường lượng thông tin mà mỗi chữ Hán hay chữ cái mang lại?"
"Tin học hiện đại sử dụng entropy để đo lường lượng thông tin trung bình, entropy thể hiện tính không chắc chắn của các ký hiệu được chỉ định. Bảng chữ cái Latinh có khoảng 30 ký tự, trong khi tiếng Hán sử dụng các khối vuông làm đơn vị viết với số lượng lên đến hàng vạn. Hiển nhiên, mức độ bất định trong sự xuất hiện của chữ Hán cao hơn nhiều so với chữ cái Latinh. Từ góc độ này, lượng thông tin mà mỗi chữ Hán mang theo lớn hơn rất nhiều so với một chữ cái đơn lẻ."
"Thông qua tính toán thống kê, chúng ta thu được giá trị entropy bậc không của chữ cái tiếng Pháp là 3,98 bit, tiếng Ý là 4,00 bit, tiếng Tây Ban Nha là 4,01 bit, tiếng Anh là 4,03 bit, tiếng Đức là 4,10 bit, tiếng Romania là 4,12 bit và tiếng Nga là 4,35 bit."
"Entropy bậc một của từ vựng tiếng Anh là 10,0 bit, trong khi tiếng Hán là 11,46 bit. Điều này cho thấy ngữ nghĩa của từ vựng tiếng Hán phong phú hơn tiếng Anh rất nhiều."
Trong lúc Vương Chính Dương trình bày, một người bên cạnh bắt đầu khởi động máy chiếu, hiển thị các thành quả nghiên cứu về sự khác biệt giữa tiếng Hán và tiếng Anh.
"Chính vì tiếng Hán quá đỗi súc tích, một chữ hay một từ có thể mang hàm nghĩa vô cùng phong phú. Cùng một chữ, cùng một từ nhưng trong các ngữ cảnh hoặc ngữ điệu khác nhau, ý nghĩa lại hoàn toàn khác biệt."
"Do đó, câu văn được tạo thành từ chữ Hán có ý nghĩa càng thêm đa dạng. Thường thì một câu rất đơn giản lại ẩn chứa nhiều tầng nghĩa khác nhau."
"Ví dụ như câu: 'Mặc bao nhiêu là bao nhiêu?'"
"Câu này rất đơn giản nhưng lại có hai cách hiểu: một là mặc càng nhiều quần áo càng tốt, hai là mặc càng ít quần áo càng tốt. Hai ý nghĩa trái ngược hoàn toàn nhưng lại được biểu đạt bằng cùng một câu chữ."
"Vốn dĩ sự tinh giản trong ngôn ngữ là một điều tốt, nhưng trong lĩnh vực máy tính, bản chất cốt lõi của nó là những phép tính chính xác."
"Nếu ý nghĩa biểu đạt không minh xác, máy tính sẽ không thể thực hiện các phép tính."
"Ngược lại, tiếng Anh tuy dài dòng nhưng cấu trúc ngôn ngữ của nó có tính ổn định cao, thông tin được biểu đạt chính xác, khả năng sửa lỗi mạnh, rất thuận lợi cho việc tính toán và lập trình máy tính."
Tần Nghị chăm chú lắng nghe. Những gì Vương Chính Dương nói đều rất dễ hiểu, và với một người đã từng nghiên cứu sâu về máy tính như Tần Nghị, anh hoàn toàn nắm bắt được vấn đề.
"Theo tôi được biết, trong quá trình mã hóa chương trình, người ta luôn yêu cầu sự tinh luyện tối đa. Theo lý mà nói, ưu thế của tiếng Hán lẽ ra phải càng rõ ràng hơn mới đúng chứ?"
Nghe đến đây, Tần Nghị suy nghĩ một chút rồi đưa ra thắc mắc của mình.
"Anh nói đúng. Từ lịch sử phát triển của máy tính, lĩnh vực lập trình luôn đòi hỏi sự tinh gọn, nhất là trong giai đoạn sơ khai khi dung lượng lưu trữ còn hạn chế, mã hóa luôn phải được tối ưu hóa hết mức."
"Điều này cũng giống như thời cổ đại của chúng ta, trước khi có giấy viết, việc ghi chép chỉ có thể thực hiện trên da dê hoặc thẻ tre. Vì vật liệu khan hiếm nên người ta phải viết cực kỳ ngắn gọn, từ đó mới hình thành nên văn ngôn văn như hiện nay."
"Tuy nhiên, tinh luyện thì tinh luyện, nhưng máy tính suy cho cùng vẫn là một công cụ giải toán, một phương thức tính toán. Sự tinh luyện phải đi đôi với việc biểu đạt ý nghĩa chính xác. Tiếng Hán của chúng ta có ý nghĩa quá phong phú, dù đạt yêu cầu về độ tinh gọn nhưng chính sự phong phú đó lại gây ra những rắc rối lớn cho việc tính toán."
Nghe Tần Nghị nói vậy, Vương Chính Dương gật đầu. Là một chuyên gia trong lĩnh vực xử lý thông tin văn bản máy tính, ông hiểu rất rõ những điều này.
"Vậy nếu nói như thế, chẳng lẽ việc thực hiện lập trình và hệ điều hành bằng tiếng Hán là bất khả thi sao?"
Nghe đến đây, Tần Nghị không khỏi nhíu mày. Nghe những lời Vương Chính Dương nói, anh cảm thấy khá thất vọng và có chút bực dọc. Trong lòng anh thậm chí đã bắt đầu cân nhắc xem có nên thay người khác lên phụ trách công việc này hay không.
Đây là lần đầu tiên Tần Nghị nảy sinh ý định thay đổi nhân sự. Từ trước đến nay, anh chưa từng thay thế người phụ trách ở bất kỳ đơn vị nghiên cứu nào, nhưng lần này, anh thực sự đã dao động.
"Không phải tiếng Anh mới thực hiện được, tiếng Hán của chúng ta cũng làm được."
"Bởi vì ngôn ngữ của chúng ta có khả năng biểu đạt phong phú hơn, tôi tin rằng trong lộ trình phát triển của máy tính tương lai, ưu thế của tiếng Hán sẽ ngày càng trở nên rõ rệt."
"Hơn nữa, máy tính là máy tính, ngôn ngữ là ngôn ngữ. Tiếng Anh làm được thì tiếng Hán cũng làm được, thậm chí cả tiếng Nhật, tiếng Ả Rập hay bất kỳ ngôn ngữ nào khác cũng đều có thể. Về bản chất, mọi ngôn ngữ đều có khả năng tương đương."
"Chỉ là chúng ta đang bị tiếng Anh kìm hãm, bị tư duy lập trình hiện tại giới hạn, khiến bản thân không thể phá vỡ những khuôn mẫu cũ kỹ mà hệ thống lập trình và hệ điều hành dựa trên tiếng Anh để lại, dẫn đến việc chúng ta mãi giậm chân tại chỗ."