Máy vi tínhCông nghệ thông tin

Cách tiếp cận có ý nghĩa và theo bảng chữ cái để đo thông tin

Sự phát triển của công nghệ máy tính trong thời đại thông tin mới làm nảy sinh thêm nhiều câu hỏi, mở ra những cơ hội và kiến thức mới. Nhưng với điều này, có rất nhiều lưỡng nan cần được giải quyết. Ví dụ, khi nghiên cứu phần cứng máy tính, điều quan trọng là phải hiểu cách xử lý, ghi nhớ và truyền tệp, mã hóa dữ liệu và thông tin định dạng nào. Nhưng chủ đề chính của cuộc thảo luận là vấn đề về cách tiếp cận chính để đo lường thông tin là gì. Các ví dụ và giải thích của từng khía cạnh sẽ được mô tả chi tiết trong bài viết này.

Thông tin trong Khoa học Máy tính

Để bắt đầu hiểu các cách tiếp cận thông tin đối với việc lưu trữ dữ liệu, trước tiên cần phải tìm ra lĩnh vực thông tin đại diện cho lĩnh vực máy tính và những gì nó thể hiện. Rốt cuộc, nếu chúng ta lấy khoa học máy tính như một khoa học, thì đối tượng chính của nghiên cứu là thông tin. Chính từ gốc La Tinh và dịch sang ngôn ngữ của chúng ta có nghĩa là "người quen", "giải thích", "giảm". Mỗi khoa học sử dụng các định nghĩa khác nhau của khái niệm này. Trong lĩnh vực máy tính, đây là những thông tin về các hiện tượng và vật thể bao quanh chúng ta, làm giảm mức độ không chắc chắn và mức độ không biết đến chúng. Tuy nhiên, để lưu trữ tất cả các tệp, dữ liệu, ký hiệu trong máy tính điện tử, cần phải biết thuật toán dịch của chúng vào một dạng nhị phân và các đơn vị hiện có để đo lượng dữ liệu. Một cách tiếp cận theo thứ tự chữ cái để đo thông tin cho thấy chính xác như thế nào một máy tính chuyển đổi các ký hiệu thành một mã nhị phân của số không và số.

Thông tin mã hoá bằng máy tính điện tử

Công nghệ máy tính có thể nhận ra, xử lý, lưu trữ và truyền tải dữ liệu chỉ trong mã nhị phân. Nhưng nếu đó là một bản ghi âm, văn bản, video, hình ảnh, làm thế nào có thể một máy tính chuyển đổi các loại dữ liệu vào một loại nhị phân? Và chúng ở dạng nào được lưu trong bộ nhớ? Những câu hỏi này có thể được trả lời nếu bạn biết cách tiếp cận theo thứ tự chữ cái để xác định số lượng thông tin, khía cạnh nội dung và bản chất kỹ thuật của việc mã hóa.

Mã hoá thông tin là để mã hóa các ký tự trong một mã nhị phân bao gồm các dấu hiệu "0" và "1". Đó là kỹ thuật đơn giản để tổ chức. Tín hiệu là, nếu có, thì 0 cho biết ngược lại. Một số đang tự hỏi tại sao máy tính không thể, giống như bộ não con người, giữ số phức tạp, bởi vì chúng có kích thước nhỏ hơn. Nhưng điện toán điện tử dễ vận hành hơn với một mã nhị phân khổng lồ, thay vì lưu trữ những số liệu phức tạp trong bộ nhớ của bạn.

Hệ thống Calculus Máy tính

Chúng tôi đã sử dụng để tính từ 1 đến 10, thêm, trừ, nhân và làm các hoạt động khác nhau về số. Máy tính chỉ có thể hoạt động với hai con số. Nhưng nó trong các phân số của mili giây. Làm thế nào để máy tính mã hóa và giải mã các ký tự? Đây là một thuật toán khá đơn giản, có thể được xem xét cho một ví dụ. Một cách tiếp cận theo thứ tự chữ cái để đo thông tin, các đơn vị đo lường dữ liệu, chúng ta sẽ xem xét một chút sau đó, sau khi bản chất của việc mã hóa và giải mã dữ liệu trở nên rõ ràng.

Có rất nhiều chương trình máy tính mà trực quan dịch các hệ thống của các calculus hoặc chuỗi văn bản thành mã nhị phân và ngược lại.

Chúng tôi sẽ thực hiện các tính toán bằng tay. Việc mã hóa thông tin được thực hiện bởi bộ phận bình thường bằng 2. Vì vậy, giả sử chúng ta có một số thập phân là 217. Chúng ta cần chuyển đổi nó thành mã nhị phân. Để làm điều này, chia nó cho số 2 cho đến khi số còn lại là số không hoặc một.

  • 217/2 = 108 với phần còn lại 1. Riêng biệt, chúng tôi viết ra các phần còn lại, và họ sẽ tạo ra câu trả lời cuối cùng của chúng tôi.
  • 108/2 = 54. Ở đây số còn lại là số 0, kể từ 108 được chia hoàn toàn. Đừng quên gắn nhãn mình với đồ thừa. Rốt lại, nếu bạn mất ít nhất một con số, con số ban đầu sẽ khác.
  • 54/2 = 27, phần còn lại là 0.
  • 27/2 = 13, viết 1 cho phần còn lại. Số của chúng tôi từ phần còn lại tạo ra một mã nhị phân, mà phải được đọc theo thứ tự ngược lại.
  • 13/2 = 6. Ở đây đơn vị là trong phần còn lại, chúng tôi viết nó ra.
  • 6/2 = 3 với phần còn lại của 0. Trong câu trả lời cuối cùng, các con số nên là một trong hơn tất cả các hành động bạn thực hiện.
  • 3/2 = 1 với phần còn lại 1. Chúng tôi ghi lại phần còn lại và số 1, là phần cuối cùng.

Nếu bạn định dạng câu trả lời, bắt đầu với số trong hành động đầu tiên, kết quả là 10011011, nhưng điều này là không chính xác. Số nhị phân phải được viết lại theo thứ tự ngược lại. Đây là kết quả cuối cùng của việc dịch số: 11011001. Cách tiếp cận có ý nghĩa và theo thứ tự chữ cái để đo thông tin sử dụng dữ liệu chính xác định dạng này để lưu trữ và truyền. Mã nhị phân được ghi vào bảng mã và lưu trữ ở đó cho đến khi bạn cần hiển thị nó trên màn hình. Sau đó, thông tin được dịch sang dạng quen thuộc, được gọi là giải mã.

Hình ảnh rõ ràng cho thấy các thuật toán để dịch từ nhị phân đến thập phân. Nó được thực hiện bằng một công thức đơn giản. Số đầu tiên của mã được nhân với 2 với sức mạnh của 0, chúng ta thêm nó vào chữ số tiếp theo nhân với 2 đến mức lớn hơn, và vân vân. Kết quả là, như có thể nhìn thấy từ hình ảnh, chúng tôi nhận được số lượng giống như bản gốc khi mã hóa.

Cách tiếp cận theo thứ tự chữ cái để đo thông tin: bản chất, đơn vị

Để đo lượng dữ liệu trong một chuỗi các ký tự văn bản, bạn cần sử dụng phương pháp tiếp cận hiện tại. Nội dung của văn bản không quan trọng ở đây, điều chính là sự tương quan định lượng của các dấu hiệu. Do khía cạnh này, giá trị của tin nhắn văn bản được mã hóa trên máy tính được tính toán. Theo cách tiếp cận này, giá trị định lượng của văn bản tỷ lệ thuận với số ký tự nhập từ bàn phím. Do phương pháp đo khối lượng thông tin này thường được gọi là thể tích. Các biểu tượng có thể khá khác nhau về cường độ. Rõ ràng là các con số như 0 và 1 mang 1 bit thông tin, và các chữ cái, dấu chấm câu, khoảng cách - một trọng lượng khác. Bạn có thể nhìn vào bảng ASCII để tìm ra mã nhị phân của một nhân vật cụ thể. Để tính toán khối lượng văn bản yêu cầu, bạn cần phải thêm trọng lượng của tất cả các dấu hiệu - phần cấu thành của toàn bộ văn bản. Đây là cách tiếp cận theo thứ tự chữ cái để xác định lượng thông tin.

Trong khoa học máy tính, có rất nhiều thuật ngữ ngày càng được sử dụng trong cuộc sống hàng ngày. Vì vậy, bảng chữ cái trong khoa học máy tính có nghĩa là một bộ tất cả các biểu tượng, bao gồm dấu ngoặc vuông, dấu cách, dấu chấm câu, ký hiệu Cyrillic, các ký tự Latin, không có gì khác ngoài một thành phần văn bản. Ở đây có hai định nghĩa, theo đó giá trị đưa ra sẽ được tính toán.

1. Do định nghĩa đầu tiên, có thể tính toán sự xuất hiện của các ký tự trong một tin nhắn văn bản, khi xác suất xuất hiện của chúng hoàn toàn khác nhau. Vì vậy, chúng ta có thể nói rằng một số chữ cái trong từ Nga có vẻ rất hiếm, ví dụ "ъ" hoặc "ё".

2. Nhưng trong một số trường hợp, cần tính toán số lượng cần thiết bằng cách giới thiệu sự xuất hiện có thể thay thế của mỗi biểu tượng. Và sau đó một công thức tính sẽ được sử dụng.

Đây là cách tiếp cận theo thứ tự chữ cái để đo thông tin.

Sự xuất hiện xác suất bằng nhau của các ký tự trong một tập tin văn bản

Để giải thích định nghĩa này, cần phải giả định rằng tất cả các dấu hiệu trong văn bản hoặc tin nhắn xuất hiện cùng tần số. Để tính toán xem chúng chiếm bao nhiêu bộ nhớ trong máy tính, cần phải lao vào lý thuyết xác suất và kết luận logic đơn giản.

Giả sử văn bản được hiển thị trên màn hình. Chúng ta đang phải đối mặt với nhiệm vụ tính toán lượng bộ nhớ máy tính cần thiết. Hãy để văn bản bao gồm 100 ký tự. Nó chỉ ra rằng xác suất xuất hiện của một chữ cái, biểu tượng hoặc dấu hiệu sẽ là một phần trăm của tổng khối lượng. Nếu bạn đọc một cuốn sách về lý thuyết xác suất, bạn có thể tìm thấy một công thức đơn giản đó sẽ xác định chính xác giá trị số của cơ hội xuất hiện một dấu hiệu ở bất kỳ vị trí nào của văn bản.

Có thể, bằng chứng của công thức và định lý sẽ không phải là thú vị đối với tất cả mọi người, do đó, có tính đến các công thức của các nhà khoa học nổi tiếng, một biểu hiện được tính toán có nguồn gốc:

I = log 2 (1 / p) = log 2 N (bit); 2 i = N,

Trong đó i là giá trị mà chúng ta cần biết, p là một giá trị số của khả năng ký hiệu vị trí văn bản, trong hầu hết các trường hợp là N, bởi vì máy tính mã hóa dữ liệu thành một mã nhị phân bao gồm hai số lượng.

Cách tiếp cận theo thể tích theo bảng chữ cái để đo thông tin giả định rằng trọng lượng của một ký tự chỉ bằng 1 bit - đơn vị đo tối thiểu. Theo công thức này, có thể xác định số byte, kilobyte, megabyte, v.v ...

Xác suất khác nhau của sự xuất hiện của các ký hiệu trong văn bản

Nếu chúng ta giả định rằng các dấu hiệu xuất hiện với các tần số khác nhau (tương ứng, và ở bất kỳ vị trí nào của văn bản xác suất xảy ra của chúng là khác nhau), thì chúng ta có thể nói rằng trọng lượng thông tin của họ cũng khác nhau. Cần phải tính phép đo thông tin theo một công thức khác. Cách tiếp cận theo thứ tự chữ cái của các chủ đề là phổ quát, hàm ý cả khả năng bình đẳng và khác nhau về tần xuất xuất hiện của một dấu hiệu trong văn bản. Chúng ta sẽ không chạm vào công thức phức tạp để tính toán số lượng này, có tính đến xác suất khác nhau của sự xuất hiện của biểu tượng. Cần phải hiểu rằng các chữ cái như "ъ", "х", "ф", "ч", bằng các từ Nga ít gặp hơn. Do đó, cần phải xem xét tần suất xuất hiện theo công thức khác. Sau khi đưa ra một số tính toán, các nhà khoa học đã đi đến kết luận rằng trọng lượng thông tin của các ký hiệu ít khi gặp phải là lớn hơn nhiều so với trọng lượng của các chữ cái thường gặp. Để tính toán số lượng văn bản, bạn cần tính đến số lần lặp lại của mỗi ký tự và trọng lượng thông tin, cũng như kích cỡ của bảng chữ cái.

Đo lường thông tin: sự tinh tế của khía cạnh nội dung

Bạn có thể bỏ qua cách tiếp cận theo thứ tự chữ cái để đo thông tin. Tin học cung cấp một khía cạnh khác của việc đo dữ liệu - có ý nghĩa. Ở đây, một vấn đề hơi khác nhau đang được giải quyết. Giả sử một người ngồi ở máy tính nhận được thông tin về một hiện tượng hoặc một số đối tượng. Rõ ràng trước rằng ông không biết gì, vì vậy có một số lượng nhất định các lựa chọn có thể hoặc dự kiến. Sau khi đọc tin nhắn, sự không chắc chắn biến mất, để lại một lựa chọn, giá trị của nó phải được tính. Chúng tôi chuyển sang công thức phụ trợ. Giá trị sẽ được tính bằng đơn vị nhỏ nhất. Giống như cách tiếp cận theo thứ tự chữ cái để đo lượng thông tin, công thức chính xác sẽ được chọn có tính đến 2 tình huống có thể xảy ra: xác suất xảy ra sự kiện khác nhau và bằng nhau.

Sự kiện gặp phải với xác suất bằng nhau

Như trong trường hợp một cách tiếp cận chữ cái khách quan để đo lường thông tin được áp dụng, công thức yêu cầu trong phương pháp tiếp cận có ý nghĩa được tính toán dựa trên tính chính xác đã biết mà nhà khoa học Hartley đã suy luận:

2 i = N,

Trường hợp i là cường độ của sự kiện mà chúng ta cần tìm, và N là số lượng các sự kiện gặp phải ở tần số có thể thay thế được. Giá trị của i được tính trong đơn vị tính toán tối thiểu - bit. Người ta có thể biểu đạt bằng logarithm.

Ví dụ về tính toán sự kiện equiprobability

Hãy nói rằng chúng ta có 64 quả bùn trên đĩa, trong đó có một thứ bất ngờ bị ẩn thay vì thịt. Cần phải tính toán bao nhiêu thông tin mà sự kiện này có chứa khi đó là những viên pelman đã được rút ra với một sự ngạc nhiên, nghĩa là, để đo lường thông tin. Cách tiếp cận chữ cái đơn giản như mục tiêu. Trong hai trường hợp, cùng một công thức sẽ được sử dụng để tính toán số lượng tài liệu thông tin. Chúng ta thay thế công thức nổi tiếng về số lượng: 2 i = 64 = 2 6 . Kết quả: i = 6 bit.

Đo lường thông tin có tính đến xác suất khác nhau của sự xuất hiện của một sự kiện

Giả sử chúng ta có một sự kiện với xác suất xuất hiện của p. Chúng ta sẽ giả định rằng giá trị i, được tính bằng các bit, là một số mô tả sự thật rằng sự kiện đã xảy ra. Dựa vào điều này, có thể lập luận rằng các giá trị có thể được tính từ công thức hiện tại: 2 i = 1 / p.

Sự khác nhau giữa cách tiếp cận theo thứ tự và thông tin với chiều hướng thông tin

Than cách tiếp cận khối lượng khác với đáng kể? Rốt lại, các công thức tính số lượng thông tin là hoàn toàn giống nhau. Sự khác biệt là khía cạnh chữ cái có thể được sử dụng nếu bạn làm việc với văn bản, trong khi nội dung cho phép bạn giải quyết bất kỳ vấn đề nào về lý thuyết xác suất, tính số lượng thông tin của một số sự kiện có tính đến sự xuất hiện có thể xảy ra của nó.

Kết luận

Một cách tiếp cận theo thứ tự chữ cái để đo thông tin giống như cách thức có ý nghĩa, tạo cơ hội để tìm ra đơn vị dữ liệu nào và khối lượng nào sẽ được chiếm bởi các dấu hiệu văn bản hoặc bất kỳ thông tin nào khác. Chúng tôi có thể dịch bất kỳ văn bản và số tập tin, tin nhắn vào mã máy tính và trở lại, trong khi luôn luôn biết bao nhiêu bộ nhớ họ sẽ chiếm trong một máy tính.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 vi.birmiss.com. Theme powered by WordPress.