Probability Theory - Lý thuyết xác xuất cho kỹ sư (Pending)

Mở đầu

Xác xuất là ngành chuyên nghiên cứu về sự không chắc chắn, trong bài viết này, chỉ nghiên cứu một nhánh nhỏ của xác xuất gọi là measure theory, áp dụng cho các thuật toán, mô hình trí tuệ nhân tạo hiện tại. Hãy bắt đầu chuyến đi dạo lại về xác xuất nếu bạn đã từng học nó với tôi.

1.Elements of probability

Có 3 thuộc tính gọi là Axioms of Probability (3 tiên đề của xác xuất), bạn có thể tìm hiểu, mình sẽ lấy ví dụ luôn.

Hãy xem xét một con xúc xắc gồm 6 mặt, không gian mẫu (sample space) sẽ là $\omega$ = {1, 2, 3, 4, 5, 6}, mỗi một tập các biến cố của sự kiện trên gọi là không gian con, ví dụ P ({1, 2, 3, 4}) = 4/6 and P ({1, 2, 3}) = 3/6 .

Một số tính chất của các không gian con:

1.1 Conditional probability and independence - Xác xuất có điều kiện và tính độc lập

Xác xuất có điều kiện là xác xuất của một biến cố A nào đó, biết rằng biến cố B xảy ra. Với B khác 0, ta có:

Có thể hiểu là xác xuất P(A|B) là xác xuất của A sau khi quan sát sự kiện B. Cả hai sự kiện được gọi là độc lập xảy ra khi P(A∩B)= P(A)P(B) hoặc P(A|B) = P(A)

2.Random variables - Biến ngẫu nhiên

Biến ngẫu nhiên là một hàm toán học với đặc điểm nó gán giá trị cho kêt quả đầu ra của một phép thử ngẫu nhiên.

Nếu X(ω) chỉ nhận 1 số hữu hạn giá trị, nó gọi là biến ngẫu nhiên rời rạc (discrete random variable):

Nếu X(w) nhận giá trị trong 1 khoảng nào đó, nó gọi là biến ngẫu nhiên liên tục:

2.1 Cumulative distribution functions - Hàm phân phối tích lũy

Một số tính chất

2.2 Probability mass functions - Hàm khối xác xuất

Hàm này cho biết xác xuất đẻ một biến ngẫu nhiên rời rạc X bằng với mọt giá trị x nào đó trong miền giá trị của nó.

Một số tính chất

2.3 Probability density functions - Hàm mật độ xác xuất

Đối với 1 số biến ngâu xnhieen liên tục, hàm phân phối tích lũy $F_x(x)$ phân biệt ở mọi nơi. Trong trường hợp này, ta có hàm mật độ xác xuất (PDF) là đạo hàm của hàm CDF (phân phối tích lũy).

Một số tính chất

2.4 Expectation - Kỳ vọng

Định nghĩa kỳ vọng chún ta đã hiểu là trung bình, nhưng ở đây định nghĩa kỳ vọng theo một cách khác, là tổng các tích giữa xác xuất xảy ra của mỗi giá trị có thể của biến với giá trị đó.

Giả sử một biến ngẫu nhiên rời rạc X với PMF là $p_x(x)$ và g là một hàm số tùy ý, trong trường hợp này, có thể coi g(x) là một biến ngẫu nhiên, chúng ta định nghĩa giá trị kỳ vọng của g(x) như sau:

Nếu x là biến ngẫu nhiên liên tục với PDF $p_x(x)$ thì giá trị kỳ vọng g(x) được định nghĩa như sau:

Một số tính chất:

2.5 Variance - Phương sai

Phương sai của một biến ngẫu nhiên X là thước đo độ tập trung phân phối của biến ngẫu nhiên X quanh giá trị trung bình (kỳ vọng của nó).

Ví dụ, tính toán kỳ vọng và phương sai biến ngẫu nhiên X với PDF $f_x(x)=1$:

2.6. Một số biến ngẫu nhiên phổ biến

Biến ngẫu nhiên rời rạc

+ X ∼ Bernoulli(p) (0 ≤ p ≤ 1): ví dụ khi tung đồng xu, 1 nếu xác xuất p xuất hiện và 0 nếu xác xuất p không xuât hiện.

+ X ∼ Binomial(n, p) (nơi 0 ≤ p ≤ 1), ví dụ xác xuất khi tung n đồng xu với x lần sấp:

+ X ∼ Geometric(p) (p > 0), ví dụ cần tính xác xuất tung đồng xu chọn đúng nếu đã thất bại x-1 lần, thì xác xuất lần thứ x được tính là :

X ∼ P oisson(λ) (nơi λ > 0): thường được sử dụng trong các sự kiện xác xuất xảy ra thấp, ví dụ xác xuất để Google sập là vô cùn nhỏ.

Biến ngẫu nhiên liên tục

+ X ∼ Uniform(a, b) là phân phỗi xác xuất thống kê trong đó các tất cả các kết quả có khả năng xảy ra như nhau, ví dụ khi tung đồng xu:

+ X ∼ Exponential(λ)

+ X ∼ N ormal(µ, σ 2 )

3. Two random variables (Hai biến ngẫu nhiên)

3.1 Joint and marginal distributions

Nhận xét

Bài đăng phổ biến từ blog này

Hiểu về Norm Regularization

Những thuật toán nền tảng trong lĩnh vực Trí tuệ nhân tạo (Artificial Intelligence I)