1.1 集合、函数与符号 在本书中,我们尽量使用通用的符号和术语。我们采用将集合用大写字母表示,集合的元素用小写字母表示的约定。直观地说,我们将集合视为满足某个给定条件或属性的对象的集合,例如整数的集合、本书中的页面或在列表中列出的对象的集合。这些对象被称为集合的元素。给定一个集合A A A ,表示为x ∈ A x \in A x ∈ A ,意味着x x x 是A A A 的一个元素,符号∈ \in ∈ 表示“是集合的元素”或“是集合的成员”,而符号 ∉ \notin ∈ / 对应于“不是集合的成员”或“不是集合的元素”。存在一个集合没有任何元素,这个集合被称为空集,用符号 ∅ \varnothing ∅ 表示。
本书中,我们将使用一些符号逻辑的符号来缩短陈述。例如,如果p p p 和q q q 代表数学命题,那么论断p ⇒ q p \Rightarrow q p ⇒ q 表示“p p p 蕴含q q q ”,或者等价地说,“如果p p p 为真,则q q q 为真”。论断p ⇔ q p \Leftrightarrow q p ⇔ q 读作“p p p 当且仅当q q q ”,意味着p p p 和q q q 在逻辑上等价,即p ⇒ q p \Rightarrow q p ⇒ q 和q ⇒ p q \Rightarrow p q ⇒ p 。
对于表达式 p ( x ) p(x) p ( x ) ,当特定论域的值代入 x x x 后变成一个命题,则称该表达式为一个"propositional function "(命题函数 )。或者等价的,x x x 为条件,p p p 为性质(property)或谓词 。断言“x x x 具有性质 p p p ” 意味着 p ( x ) p(x) p ( x ) 为真。例如,如果 p ( x ) p(x) p ( x ) 是命题函数“x x x 是整数”,那么 p p p 表示性质“是整数”,p ( 2 ) p(2) p ( 2 ) 为真,而 p ( 1 2 ) p(\frac{1}{2}) p ( 2 1 ) 为假。
Harry:
在谓词逻辑中,p ( x ) p(x) p ( x ) 代表一个谓词(predicate),它是一个包含变量的命题,表示x x x 具有某种性质或满足某种条件。这里,x x x 是一个变量,可以代表任意个体或对象。当你为变量x x x 指定一个特定的值时,p ( x ) p(x) p ( x ) 就成为一个命题,可以是真(true)或假(false)。
例如,如果我们定义一个谓词P ( x ) P(x) P ( x ) 表示“x x x 是一个偶数”,那么P ( 2 ) P(2) P ( 2 ) 是真,P ( 3 ) P(3) P ( 3 ) 是假。在这个例子中,x x x 代表一个整数,而P ( x ) P(x) P ( x ) 表示一个性质,即偶数性质。
一个集合可以通过描述其特性属性或列举其元素来定义。通常,这两种描述方式都可以用大括号括起来。当使用特性属性描述时,集合的表示形式为{ x : p ( x ) } \{ x : p(x) \} { x : p ( x )} ,它的意思是“所有满足性质 p ( x ) p(x) p ( x ) 的元素 x x x 组成的集合”。例如,正整数 1 到 5 的集合可以表示为{ x : x 是小于 6 的正整数 } \{ x : x \text{ 是小于 6 的正整数} \} { x : x 是小于 6 的正整数 } 。在这里, p ( x ) p(x) p ( x ) 是命题“x x x 是小于 6 的正整数”,而 p p p 表示性质“是小于 6 的正整数”。这个集合也可以通过列举其元素来定义:{ 1 , 2 , 3 , 4 , 5 } \{1, 2, 3, 4, 5\} { 1 , 2 , 3 , 4 , 5 } 。在我们的讨论中,我们假设构造X = { x : p ( x ) } X = \{x : p(x)\} X = { x : p ( x )} 是一个集合,当且仅当对于给定的对象 x x x ,命题 p ( x ) p(x) p ( x ) 要么为真,要么为假(即,不能同时为真和假)。这使得我们可以确定某个对象是否是集合 X X X 的元素。
存在量词“存在”用符号∃ \exists ∃ 表示,而符号 ∄ \nexists ∄ 表示“不存在”。存在量词“存在一个且仅一个”或等价地“存在唯一的”用符号 ∃ ! \exists! ∃ ! 表示。全称量词“对于所有”用符号 ∀ \forall ∀ 表示。连接词“使得”的常用符号是 ∋ \ni ∋ 。因此,命题∀ x ∃ y ∋ ∀ z : p ( x , y , z ) \forall x \exists y \ni \forall z : p(x, y, z) ∀ x ∃ y ∋ ∀ z : p ( x , y , z ) 的含义是:“对于每个 x x x ,存在一个y y y 使得对于所有的 z z z ,命题 p ( x , y , z ) p(x, y, z) p ( x , y , z ) 为真。”
Harry:
在数学命题中,"implies(蕴含)" 表示逻辑蕴含关系,通常用符号 "⇒ \Rightarrow ⇒ " 表示,表示一个命题的成立蕴含着另一个命题的成立。而"so that(使得)"则通常用于描述一个行动或条件,指的是某个结果或目的,它并不涉及逻辑关系。在数学语境中,通常我们使用 "implies" 来表示逻辑关系,而 "so that" 则用于描述目的或结果。
换言之, ⇒ \Rightarrow ⇒ 用在命题间,而∋ \ni ∋ 用于命题中
如果 X X X 和 Y Y Y 是集合,那么 X = Y X = Y X = Y 意味着它们具有相同的元素;即,∀ x : x ∈ X ⇒ x ∈ Y \forall x : x \in X \Rightarrow x \in Y ∀ x : x ∈ X ⇒ x ∈ Y 。符号 X ⊆ Y X \subseteq Y X ⊆ Y 读作“X X X 是 Y Y Y 的子集”,表示 X X X 的每个元素都是 Y Y Y 的元素。更准确地说,∀ x : x ∈ X ⇒ x ∈ Y \forall x : x \in X \Rightarrow x \in Y ∀ x : x ∈ X ⇒ x ∈ Y 。这里并不排除相等的情况。因此,在必要时,我们会说如果 X ⊆ Y X \subseteq Y X ⊆ Y 且 X ≠ Y X \neq Y X = Y ,那么 X X X 是 Y Y Y 的真子集 (proper subset )。集合的所有子集构成的集合称为给定集合 X X X 的幂集,表示为 2 X 2^X 2 X 。上述定义直接导出了以下子集关系定律 :
S 1 S_1 S 1 :对于任意集合 X X X ,X ⊆ X ; X \subseteq X ;\\ X ⊆ X ; S 2 S_2 S 2 :如果 X ⊆ Y X \subseteq Y X ⊆ Y 且 Y ⊆ Z Y \subseteq Z Y ⊆ Z ,那么 X ⊆ Z ; X \subseteq Z ;\\ X ⊆ Z ; S 3 S_3 S 3 :X = Y X = Y X = Y 当且仅当 X ⊆ Y X \subseteq Y X ⊆ Y 且 Y ⊆ X ; Y \subseteq X ;\\ Y ⊆ X ; S 4 S_4 S 4 :对于任意集合 X X X ,∅ ⊆ X ; \varnothing \subseteq X ;\\ ∅ ⊆ X ; S 5 S_5 S 5 :∅ ∈ 2 X \varnothing \in 2^X ∅ ∈ 2 X 且对于任意 x ∈ X x \in X x ∈ X ,{ x } ∈ 2 X \{x\} \in 2^X { x } ∈ 2 X
Harry:
在数学中,定理(Theorem)和定律(Law)是两个不同的概念:
定理 :定理是数学中的一个重要概念,是通过严格的推导和证明得出的数学命题。一个定理通常是基于一组公理或已经被证明的定理,并且在特定的逻辑体系下被证明成立。定理通常用于描述更一般性的数学关系和性质,它的证明需要严密的逻辑推理和数学符号的运用。定理在数学中具有普遍性和广泛应用性。
定律 :定律通常是对一类现象或数学关系的普适性规律的描述。定律并不一定需要进行严格的证明,而是基于观察和实验得出的普遍性规律。在数学中,定律通常指代一些基本的数学关系,例如交换律、结合律、分配律等。这些定律在特定的数学运算中具有普遍适用性。
总的来说,定理是通过严密证明得出的数学命题,而定律通常是基于观察和实验得出的一般性规律。
尽管这些子集关系是不言而喻的,但它们具有根本的重要性,因为我们将讨论许多其他与S 1 S_1 S 1 到S 4 S_4 S 4 中所述类似的关系。
除了子集关系外,还有为集合的集合(a collection of sets)的代数结构提供了三种基本的集合操作。对于这样的代数结构,习惯上将所考虑的集合视为某个更大的集合U U U 的子集,称为全集(universal set)或 论域全集(universe of discouse) ,通常用符号U U U 表示 。例如,在平面几何中,全集包含了平面上的所有点。
定义 1.1
令 X X X 和 Y Y Y 为两个集合。X X X 和 Y Y Y 的并集,用符号 X ∪ Y X \cup Y X ∪ Y 表示,定义为那些在 X X X 中或在 Y Y Y 中、或者同在两者中的元素的集合。因此,
X ∪ Y = { z : z ∈ X 或 z ∈ Y } X \cup Y = \{z : z \in X \text{ 或 } z \in Y\} X ∪ Y = { z : z ∈ X 或 z ∈ Y }
X X X 和 Y Y Y 的交集,用符号 X ∩ Y X \cap Y X ∩ Y 表示,定义为那些既在 X X X 中又在 Y Y Y 中的所有元素的集合。因此,
X ∩ Y = { z : z ∈ X 且 z ∈ Y } X \cap Y = \{z : z \in X \text{ 且 } z \in Y\} X ∩ Y = { z : z ∈ X 且 z ∈ Y }
尽管符号 X c X^c X c 通常用于表示 X X X 的补集,但本书中将使用符号 X ′ X' X ′ 来表示补集。
补集 X ′ X' X ′ 不应与 X X X 和 Y Y Y 的差集混淆。二者差集也称为 X X X 减去 Y Y Y ,以及相对于 Y Y Y 的补集。X X X 和 Y Y Y 的差集,表示为 X \ Y X \backslash Y X \ Y ,其定义为 X \ Y = { x : x ∈ X 且 x ∉ Y } X \backslash Y = \{x : x \in X \text{ 且 } x \notin Y\} X \ Y = { x : x ∈ X 且 x ∈ / Y } 。因此,X ′ = U \ X X' = U \backslash X X ′ = U \ X 。以下定理给出了 ∪ \cup ∪ 、∩ \cap ∩ 和 ⊆ \subseteq ⊆ 之间的关系:
定理1.1 以下陈述是等价的:
(i) X ⊆ Y X \subseteq Y \\ X ⊆ Y (ii) X = X ∩ Y X = X \cap Y \\ X = X ∩ Y (iii) Y = X ∪ Y Y = X \cup Y \\ Y = X ∪ Y (iv) Y ′ ⊆ X ′ Y' \subseteq X' Y ′ ⊆ X ′ 且 X ∩ Y ′ = ∅ X \cap Y'= \varnothing X ∩ Y ′ = ∅
基本集合操作(并、交、差)的规则如下:
S 6 S_6 S 6 (恒等律): X ∪ U = U X ∪ ∅ = X \begin{array}{l} X \cup U = U \\ X \cup \varnothing = X \end{array} X ∪ U = U X ∪ ∅ = X 及 X ∩ U = X X ∩ ∅ = ∅ \begin{array}{l} X \cap U = X \\ X \cap \varnothing = \varnothing \end{array} X ∩ U = X X ∩ ∅ = ∅ ;
S 7 (幂等律) S_7(幂等律) S 7 (幂等律) :X ∪ X = X X \cup X = X X ∪ X = X , X ∩ X = X X \cap X = X X ∩ X = X ;
S 8 S_8 S 8 (补集律): ( X ′ ) ′ = X X ∪ X ′ = U \begin{array}{l} (X')'=X \\ X \cup X' = U \end{array} ( X ′ ) ′ = X X ∪ X ′ = U 及 ∅ ′ = U , U ′ = ∅ X ∩ X ′ = ∅ \begin{array}{l} \varnothing' = U, U'=\varnothing\\ X \cap X' =\varnothing \end{array} ∅ ′ = U , U ′ = ∅ X ∩ X ′ = ∅ ;
S 9 S_9 S 9 (结合律):( X ∪ Y ) ∪ Z = X ∪ ( Y ∪ Z ) (X \cup Y) \cup Z = X \cup (Y \cup Z) ( X ∪ Y ) ∪ Z = X ∪ ( Y ∪ Z ) , ( X ∩ Y ) ∩ Z = X ∩ ( Y ∩ Z ) (X \cap Y) \cap Z = X \cap (Y \cap Z) ( X ∩ Y ) ∩ Z = X ∩ ( Y ∩ Z ) ;
S 10 S_{10} S 10 (交换律):X ∪ Y = Y ∪ X X \cup Y = Y \cup X X ∪ Y = Y ∪ X , X ∩ Y = Y ∩ X X \cap Y = Y \cap X X ∩ Y = Y ∩ X ;
S 11 S_{11} S 11 (分配律):X ∪ ( Y ∩ Z ) = ( X ∪ Y ) ∩ ( X ∪ Z ) X \cup (Y \cap Z) = (X \cup Y) \cap (X \cup Z) X ∪ ( Y ∩ Z ) = ( X ∪ Y ) ∩ ( X ∪ Z ) , X ∩ ( Y ∪ Z ) = ( X ∩ Y ) ∪ ( X ∩ Z ) X \cap (Y \cup Z) = (X \cap Y) \cup (X \cap Z) X ∩ ( Y ∪ Z ) = ( X ∩ Y ) ∪ ( X ∩ Z ) ;
S 12 S_{12} S 12 (德摩根定律):( X ∪ Y ) ′ = X ′ ∩ Y ′ (X \cup Y)' = X' \cap Y' ( X ∪ Y ) ′ = X ′ ∩ Y ′ , ( X ∩ Y ) ′ = X ′ ∪ Y ′ (X \cap Y)' = X' \cup Y' ( X ∩ Y ) ′ = X ′ ∪ Y ′ ;
S 13 S_{13} S 13 (等价律):∅ = A \ A ′ \varnothing = A \backslash A' ∅ = A \ A ′ , A ∩ B = A \ ( A \ B ) A \cap B = A \backslash (A \backslash B) A ∩ B = A \ ( A \ B ) 。
除了并集和交集等集合操作之外,集合的笛卡尔积是将两个集合组合起来的最重要的构造方法之一,因为它使我们能够用集合的术语来表示许多概念。
定义 1.2 假设X X X 和Y Y Y 是两个集合。X X X 和Y Y Y 的笛卡尔积,表示为X × Y X \times Y X × Y ,它是所有有序对{ ( x , y ) : x ∈ X 且 y ∈ Y } \{(x, y) : x \in X \text{且} y \in Y\} {( x , y ) : x ∈ X 且 y ∈ Y } 组成的集合。
笛卡尔积也被称为叉积。集合X × Y X × Y X × Y 中的元素( x , y ) (x, y) ( x , y ) 表示该有序对的第一个分量x x x 必须是集合X X X 的元素,而第二个分量y y y 必须是集合Y Y Y 的元素。此外,这些有序对受到以下条件的限制:( a , b ) = ( c , d ) ⇔ a = c , b = d (a,b) = (c,d) \Leftrightarrow a = c,b = d ( a , b ) = ( c , d ) ⇔ a = c , b = d 。有序对的分量也被称为坐标。
笛卡尔积的概念扩展了基本集合论操作集。然而,与并集和交集相比,笛卡尔积既不满足交换律也不满足结合律。当X ≠ Y X ≠ Y X = Y 时,X × Y ≠ Y × X X × Y ≠ Y × X X × Y = Y × X 。根据该乘积的定义,( X × Y ) × Z ≠ X × ( Y × Z ) (X × Y) × Z ≠ X × (Y × Z) ( X × Y ) × Z = X × ( Y × Z ) 。例如,集合( X × Y ) × Z (X × Y) × Z ( X × Y ) × Z 中元素( ( x , y ) , z ) ((x,y),z) (( x , y ) , z ) 的第一个分量可能对应于一个位置( x , y ) (x,y) ( x , y ) ,而第二个分量z z z 对应该位置的温度。在这种情况下,元素( x , ( y , z ) ) (x,(y,z)) ( x , ( y , z )) 属于集合X × ( Y × Z ) X × (Y × Z) X × ( Y × Z ) 具有完全不同的含义。而等式( ( x , y ) , z ) = ( x , ( y , z ) ) ((x,y),z) = (x,(y,z)) (( x , y ) , z ) = ( x , ( y , z )) 意味着x = ( x , y ) x = (x,y) x = ( x , y ) 且z = ( y , z ) z = (y,z) z = ( y , z ) 。此外,X × Y = ∅ ⇔ X = ∅ 或 Y = ∅ X × Y = \varnothing \Leftrightarrow X = \varnothing \text{或} Y = \varnothing X × Y = ∅ ⇔ X = ∅ 或 Y = ∅ (或者两者都是)。
笛卡尔积与并集和交集的关系可以总结如下:
定理 1.2
X × ( Y ∪ Z ) = ( X × Y ) ∪ ( X × Z ) 且 X × ( Y ∩ Z ) = ( X × Y ) ∩ ( X × Z ) X \times (Y \cup Z) = (X \times Y) \cup (X \times Z) \; \text{且} \; X \times (Y \cap Z) = (X \times Y) \cap (X \times Z) X × ( Y ∪ Z ) = ( X × Y ) ∪ ( X × Z ) 且 X × ( Y ∩ Z ) = ( X × Y ) ∩ ( X × Z )
习题 1.1 假设A = { a , b , c } , B = { b , d } , C = { a , c , e } A = \{a, b, c\},B = \{b, d\},C = \{a, c, e\} A = { a , b , c } , B = { b , d } , C = { a , c , e } ,计算A ∪ B ∪ C A \cup B \cup C A ∪ B ∪ C ,A ∩ B ∩ C A \cap B \cap C A ∩ B ∩ C ,及A × B × C A×B×C A × B × C 和( A × B ) ∩ ( B × A ) (A×B)\cap(B×A) ( A × B ) ∩ ( B × A ) 。 Harry:
A ∪ B ∪ C = { a , b , c , d , e } A ∩ B ∩ C = ∅ A × B × C = { ( a , b , a ) , ( a , b , c ) , ( a , b , e ) , ( a , d , a ) , ( a , d , c ) , ( a , d , e ) , . . . , ( c , d , e ) } ( A × B ) ∩ ( B × A ) = ( b , b ) \begin{aligned} A \cup B \cup C & = \{a,b,c,d,e\} \\ A \cap B \cap C & = \varnothing \\ A \times B \times C & = \{(a,b,a),(a,b,c),(a,b,e),(a,d,a),(a,d,c),(a,d,e),...,(c,d,e)\} \\ (A \times B) \cap (B \times A) &= (b,b) \end{aligned} A ∪ B ∪ C A ∩ B ∩ C A × B × C ( A × B ) ∩ ( B × A ) = { a , b , c , d , e } = ∅ = {( a , b , a ) , ( a , b , c ) , ( a , b , e ) , ( a , d , a ) , ( a , d , c ) , ( a , d , e ) , ... , ( c , d , e )} = ( b , b )
证明定理1.1。 Harry:
(i) 求证: X ⊆ Y ⟺ X = X ∩ Y X \subseteq Y \iff X=X \cap Y X ⊆ Y ⟺ X = X ∩ Y
首先证明 $$X \subseteq Y \implies X=X \cap Y$$ ( ∀ x ) x ∈ X ⇒ x ∈ Y ( ∵ X ⊆ Y ) ⇒ x ∈ X 且 x ∈ Y ⇒ x ∈ X ∩ Y \begin{aligned} (\forall x) \; x \in X & \Rightarrow x \in Y &(\because X \subseteq Y)\\ & \Rightarrow x \in X \text{且} x \in Y \\ & \Rightarrow x \in X \cap Y \\ \end{aligned} ( ∀ x ) x ∈ X ⇒ x ∈ Y ⇒ x ∈ X 且 x ∈ Y ⇒ x ∈ X ∩ Y ( ∵ X ⊆ Y )
故
X ⊆ X ∩ Y ( 1.1 ) X \subseteq X \cap Y \qquad (1.1) X ⊆ X ∩ Y ( 1.1 )
又
( ∀ x ) x ∈ X ∩ Y ⇒ x ∈ X 且 x ∈ Y ⇒ x ∈ X \begin{aligned} (\forall x) \; x \in X \cap Y & \Rightarrow x \in X \text{且} x \in Y\\ & \Rightarrow x \in X \\ \end{aligned} ( ∀ x ) x ∈ X ∩ Y ⇒ x ∈ X 且 x ∈ Y ⇒ x ∈ X
故
X ∩ Y ⊆ X ( 1.2 ) X \cap Y \subseteq X \qquad (1.2) X ∩ Y ⊆ X ( 1.2 )
由1.1,1.2可得
X = X ∩ Y ( S 3 ) X = X \cap Y \qquad (S_{3}) X = X ∩ Y ( S 3 )
因此,X ⊆ Y ⟹ X = X ∩ Y X \subseteq Y \implies X=X \cap Y X ⊆ Y ⟹ X = X ∩ Y 得证 \qquad (1.3)
然后证明 X = X ∩ Y ⟹ X ⊆ Y X = X\cap Y \implies X \subseteq Y X = X ∩ Y ⟹ X ⊆ Y :
( ∀ x ) x ∈ X ⇒ x ∈ X ∩ Y ( ∵ X = X ∩ Y ) ⇒ x ∈ X 且 x ∈ Y ⇒ x ∈ Y \begin{aligned} (\forall x) \; x \in X & \Rightarrow x \in X \cap Y & (\because X=X \cap Y)\\ & \Rightarrow x \in X \text{且} x \in Y\\ & \Rightarrow x \in Y \\ \end{aligned} ( ∀ x ) x ∈ X ⇒ x ∈ X ∩ Y ⇒ x ∈ X 且 x ∈ Y ⇒ x ∈ Y ( ∵ X = X ∩ Y )
故
X ⊆ Y X \subseteq Y X ⊆ Y
因此,X = X ∩ Y ⟹ X ⊆ Y X = X\cap Y \implies X \subseteq Y X = X ∩ Y ⟹ X ⊆ Y 得证 \qquad (1.4)
由1.3、1.4可知 :
X ⊆ Y ⟺ X = X ∩ Y X \subseteq Y \iff X=X \cap Y X ⊆ Y ⟺ X = X ∩ Y
证毕。
(iv) 求证 :X ⊆ Y ⟺ Y ′ ⊆ X ′ X \subseteq Y \iff Y' \subseteq X' X ⊆ Y ⟺ Y ′ ⊆ X ′ 且 X ∩ Y ′ = ∅ X \cap Y'= \varnothing X ∩ Y ′ = ∅
首先证明
X ⊆ Y ⟹ Y ′ ⊆ X ′ 且 X ∩ Y ′ = ∅ X \subseteq Y \implies Y' \subseteq X' \,\text{且} \,X \cap Y'= \varnothing X ⊆ Y ⟹ Y ′ ⊆ X ′ 且 X ∩ Y ′ = ∅
如下:
( ∀ y ) y ∈ Y ′ ⇒ y ∈ U 且 y ∉ Y ⇒ y ∈ U 且 y ∉ X ( ∵ X ⊆ Y ) ⇒ y ∈ X ′ \begin{aligned} (\forall y) \; y \in Y' & \Rightarrow y \in U \;\text{且}\; y \notin Y\\ & \Rightarrow y \in U \;\text{且}\; y \notin X & (\because X \subseteq Y)\\ & \Rightarrow y \in X' \\ \end{aligned} ( ∀ y ) y ∈ Y ′ ⇒ y ∈ U 且 y ∈ / Y ⇒ y ∈ U 且 y ∈ / X ⇒ y ∈ X ′ ( ∵ X ⊆ Y )
故:
Y ′ ⊆ X ′ ( 4.1 ) Y' \subseteq X' \qquad (4.1) Y ′ ⊆ X ′ ( 4.1 )
现在通过反证法证明X ∩ Y ′ = ∅ X \cap Y' = \varnothing X ∩ Y ′ = ∅ 。假设
X ∩ Y ′ ≠ ∅ X \cap Y' \neq \varnothing X ∩ Y ′ = ∅
则
( ∃ x ) x ∈ X ∩ Y ′ ⇒ x ∈ X 且 x ∈ Y ′ ⇒ x ∈ X 且 y ∉ Y \begin{aligned} (\exists x) \; x \in X \cap Y' & \Rightarrow x \in X \;\text{且}\; x \in Y'\\ & \Rightarrow x \in X \;\text{且}\; y \notin Y \\ \end{aligned} ( ∃ x ) x ∈ X ∩ Y ′ ⇒ x ∈ X 且 x ∈ Y ′ ⇒ x ∈ X 且 y ∈ / Y
这与 X ⊆ Y X \subseteq Y X ⊆ Y 矛盾。故
X ∩ Y ′ = ∅ ( 4.2 ) X \cap Y' = \varnothing \qquad (4.2) X ∩ Y ′ = ∅ ( 4.2 )
由4.1、4.2可得
X ⊆ Y ⟹ Y ′ ⊆ X ′ 且 X ∩ Y ′ = ∅ ( 4.3 ) X \subseteq Y \implies Y' \subseteq X' \,\text{且} \,X \cap Y'= \varnothing \qquad (4.3) X ⊆ Y ⟹ Y ′ ⊆ X ′ 且 X ∩ Y ′ = ∅ ( 4.3 )
然后证明
Y ′ ⊆ X ′ 且 X ∩ Y ′ = ∅ ⟹ X ⊆ Y Y' \subseteq X' \,\text{且} \,X \cap Y'= \varnothing \implies X \subseteq Y Y ′ ⊆ X ′ 且 X ∩ Y ′ = ∅ ⟹ X ⊆ Y
如下:
使用反证法,假设
X ⊈ Y ⇒ ( ∃ x ) x ∈ X 且 x ∉ Y ⇒ x ∈ X 且 x ∈ Y ′ ⇒ x ∈ X ∩ Y ′ \begin{aligned} X \nsubseteq Y &\Rightarrow (\exist x) \; x \in X \,\text{且}\, x \notin Y \\ & \Rightarrow x \in X \;\text{且}\; x \in Y'\\ & \Rightarrow x \in X \cap Y' \\ \end{aligned} X ⊈ Y ⇒ ( ∃ x ) x ∈ X 且 x ∈ / Y ⇒ x ∈ X 且 x ∈ Y ′ ⇒ x ∈ X ∩ Y ′
这与 X ∩ Y ′ = ∅ X \cap Y'= \varnothing X ∩ Y ′ = ∅ 矛盾。故
Y ′ ⊆ X ′ 且 X ∩ Y ′ = ∅ ⟹ X ⊆ Y ( 4.4 ) Y' \subseteq X' \,\text{且} \,X \cap Y'= \varnothing \implies X \subseteq Y \qquad (4.4) Y ′ ⊆ X ′ 且 X ∩ Y ′ = ∅ ⟹ X ⊆ Y ( 4.4 )
由4.3,4.4可得
X ⊆ Y ⟺ Y ′ ⊆ X ′ 且 X ∩ Y ′ = ∅ X \subseteq Y \iff Y' \subseteq X' \text{且} X \cap Y'= \varnothing X ⊆ Y ⟺ Y ′ ⊆ X ′ 且 X ∩ Y ′ = ∅
证毕。
证明定律S 6 S_6 S 6 到S 13 S_{13} S 13 。 Harry:
(S 12 S_{12} S 12 ) 求证(德摩根定律) :( X ∪ Y ) ′ = X ′ ∩ Y ′ (X \cup Y)' = X' \cap Y' ( X ∪ Y ) ′ = X ′ ∩ Y ′ , ( X ∩ Y ) ′ = X ′ ∪ Y ′ (X \cap Y)' = X' \cup Y' ( X ∩ Y ) ′ = X ′ ∪ Y ′ ;
以证明( X ∪ Y ) ′ = X ′ ∩ Y ′ (X \cup Y)' = X' \cap Y' ( X ∪ Y ) ′ = X ′ ∩ Y ′ 为例。
首先证明
( X ∪ Y ) ′ ⊆ X ′ ∩ Y ′ (X \cup Y)' \subseteq X' \cap Y' ( X ∪ Y ) ′ ⊆ X ′ ∩ Y ′
使用反证法,假设
( X ∪ Y ) ′ ⊈ X ′ ∩ Y ′ ⇒ ( ∃ x ) x ∈ ( X ∪ Y ) ′ 且 x ∉ X ′ ∩ Y ′ ⇒ x ∉ ( X ∩ Y ) 且 x ∉ X ′ 且 x ∉ Y ′ ⇒ x ∉ ( X ∩ Y ) 且 x ∈ X 且 x ∈ Y ⇒ x ∉ ( X ∩ Y ) 且 x ∈ ( X ∩ Y ) \begin{aligned} (X \cup Y)' \nsubseteq X' \cap Y' & \Rightarrow (\exist x) \; x \in (X \cup Y)' \,\text{且}\, x \notin X' \cap Y' \\ & \Rightarrow x \notin (X \cap Y) \;\text{且}\; x \notin X' \;\text{且}\; x \notin Y'\\ & \Rightarrow x \notin (X \cap Y) \;\text{且}\; x \in X \;\text{且}\; x \in Y\\ & \Rightarrow x \notin (X \cap Y) \;\text{且}\; x \in (X \cap Y)\\ \end{aligned} ( X ∪ Y ) ′ ⊈ X ′ ∩ Y ′ ⇒ ( ∃ x ) x ∈ ( X ∪ Y ) ′ 且 x ∈ / X ′ ∩ Y ′ ⇒ x ∈ / ( X ∩ Y ) 且 x ∈ / X ′ 且 x ∈ / Y ′ ⇒ x ∈ / ( X ∩ Y ) 且 x ∈ X 且 x ∈ Y ⇒ x ∈ / ( X ∩ Y ) 且 x ∈ ( X ∩ Y )
以上推论自相矛盾,故以下成立
( X ∪ Y ) ′ ⊆ X ′ ∩ Y ′ ( 12.1 ) (X \cup Y)' \subseteq X' \cap Y' \qquad (12.1) ( X ∪ Y ) ′ ⊆ X ′ ∩ Y ′ ( 12.1 )
同样可是使用反证法,假设
X ′ ∩ Y ′ ⊈ ( X ∪ Y ) ′ ⇒ ( ∃ x ) x ∈ X ′ ∩ Y ′ 且 x ∉ ( X ∪ Y ) ′ ⇒ x ∈ X ′ 且 x ∈ Y ′ 且 x ∈ ( X ∪ Y ) ⇒ x ∉ X 且 x ∉ Y 且 x ∈ ( X ∪ Y ) ⇒ x ∉ X 且 x ∉ Y 且 x ∈ X 或 x ∈ Y \begin{aligned} X' \cap Y' \nsubseteq(X \cup Y)' & \Rightarrow (\exist x) \; x \in X' \cap Y' \,\text{且}\, x \notin (X \cup Y)' \\ & \Rightarrow x \in X' \;\text{且}\; x \in Y' \;\text{且}\; x \in (X \cup Y)\\ & \Rightarrow x \notin X \;\text{且}\; x \notin Y \;\text{且}\; x \in (X \cup Y)\\ & \Rightarrow x \notin X \;\text{且}\; x \notin Y \;\text{且}\; x \in X \;\text{或}\; x \in Y\\ \end{aligned} X ′ ∩ Y ′ ⊈ ( X ∪ Y ) ′ ⇒ ( ∃ x ) x ∈ X ′ ∩ Y ′ 且 x ∈ / ( X ∪ Y ) ′ ⇒ x ∈ X ′ 且 x ∈ Y ′ 且 x ∈ ( X ∪ Y ) ⇒ x ∈ / X 且 x ∈ / Y 且 x ∈ ( X ∪ Y ) ⇒ x ∈ / X 且 x ∈ / Y 且 x ∈ X 或 x ∈ Y
以上推论自相矛盾,故以下成立
X ′ ∩ Y ′ ⊆ ( X ∪ Y ) ′ ( 12.2 ) X' \cap Y' \subseteq(X \cup Y)' \qquad (12.2) X ′ ∩ Y ′ ⊆ ( X ∪ Y ) ′ ( 12.2 )
由12.1、12.2可得
( X ∪ Y ) ′ = X ′ ∩ Y ′ (X \cup Y)' = X' \cap Y' ( X ∪ Y ) ′ = X ′ ∩ Y ′
证毕。
证明定理1.2。 Harry:
设 ( a , b ) ∈ X × ( Y ∪ Z ) (a,b) \in X \times ( Y \cup Z) ( a , b ) ∈ X × ( Y ∪ Z ) ,则由笛卡尔积定义有:
( a , b ) ∈ X × ( Y ∪ Z ) ⇒ a ∈ X 且 b ∈ Y ∪ Z ⇒ a ∈ X 且 b ∈ Y 或 b ∈ Z ⇒ ( a , b ) ∈ X × Y 或 ( a , b ) ∈ X × Z ⇒ ( a , b ) ∈ ( X × Y ) ∪ ( Y × Z ) \begin{aligned} (a,b) \in X \times ( Y \cup Z) & \Rightarrow a \in X \text{ 且 } b \in Y \cup Z \\ & \Rightarrow a \in X \text{ 且 } b \in Y \text{或} b \in Z \\ & \Rightarrow (a,b) \in X \times Y \quad \text{或} \quad (a,b) \in X \times Z \\ & \Rightarrow (a,b) \in (X \times Y) \cup (Y \times Z) \end{aligned} ( a , b ) ∈ X × ( Y ∪ Z ) ⇒ a ∈ X 且 b ∈ Y ∪ Z ⇒ a ∈ X 且 b ∈ Y 或 b ∈ Z ⇒ ( a , b ) ∈ X × Y 或 ( a , b ) ∈ X × Z ⇒ ( a , b ) ∈ ( X × Y ) ∪ ( Y × Z )
因此有
X × ( Y ∪ Z ) ⊆ ( X × Y ) ∪ ( X × Z ) X \times (Y \cup Z) \subseteq (X \times Y) \cup (X \times Z) X × ( Y ∪ Z ) ⊆ ( X × Y ) ∪ ( X × Z )
同理可得
( X × Y ) ∪ ( X × Z ) ⊆ X × ( Y ∪ Z ) (X \times Y) \cup (X \times Z) \subseteq X \times (Y \cup Z) ( X × Y ) ∪ ( X × Z ) ⊆ X × ( Y ∪ Z )
因此可得
X × ( Y ∪ Z ) = ( X × Y ) ∪ ( X × Z ) X \times (Y \cup Z) = (X \times Y) \cup (X \times Z) X × ( Y ∪ Z ) = ( X × Y ) ∪ ( X × Z )
同理可证
X × ( Y ∩ Z ) = ( X × Y ) ∩ ( X × Z ) X \times (Y \cap Z) = (X \times Y) \cap (X \times Z) X × ( Y ∩ Z ) = ( X × Y ) ∩ ( X × Z )
故,定理1.2得证
1.1.1 特殊集合和集合族 在本书中,某些数集自然而然地出现,我们将符号 R \mathbb{R} R 保留用于表示实数集, R + \mathbb{R}^+ R + 表示正实数集, R − \mathbb{R}^- R − 表示负实数集,而 R [ 0 , ∞ ) \mathbb{R}_{[0,\infty)} R [ 0 , ∞ ) 表示非负实数集合.符号 Z \mathbb{Z} Z 表示整数集 {⋯, -3, -2, -1, 0, 1, 2, 3, ⋯},N \mathbb{N} N 表示自然数集 {1, 2, 3, ⋯},N [ 0 , ∞ ) n \mathbb{N}_{[0,\infty)}n N [ 0 , ∞ ) n 表示非负整数集合 {0, 1, 2, ⋯},N n \mathbb{N}_n N n 表示小于等于 n 的自然数集合 {1, 2, 3, ⋯, n},而 Z n \mathbb{Z}_n Z n 表示小于等于 n 的整数集合 {0, 1, 2, ⋯, n-1}。
当 a a a 和 b b b 为实数时,关系 a < b a < b a < b 、a ≤ b a ≤ b a ≤ b 、b > a b > a b > a 和 b ≥ a b ≥ a b ≥ a 分别表示 a a a 严格小于 b b b 、a a a 小于等于 b b b 、b b b 严格大于 a a a 和 b b b 大于等于 a a a 。关系 ≤ ≤ ≤ (或 ≥ ≥ ≥ )是实数集 m a t h b b R mathbb{R} ma t hbb R 上的一种称为实数集的自然序的序关系。这个序关系具有额外的性质,对于任意的实数 a a a 和 b b b ,要么 a ≤ b a ≤ b a ≤ b ,要么 b ≤ a b ≤ a b ≤ a 。这种类型的序被称为全序 ,因为任意两个元素都是相关联的。关于集合的序关系的精确定义将在第三章给出。在整数的顺序法则和子集法则之间存在一些相似之处。例如,在考虑集合 N [ 0 , ∞ ) \mathbb{N}_{[0,\infty)} N [ 0 , ∞ ) 时,我们可以看到以下陈述:
S 1 . x ≤ x ∀ x ∈ N [ 0 , ∞ ) S 2 . 如果 x ≤ y 且 y ≤ z , 则 x ≤ z S 3 . x = y 当且仅当 , x ≤ y 且 y ≤ x S 4 . 0 ≤ x ∀ x ∈ N [ 0 , ∞ ) \begin{aligned} S_1. \quad & x \leq x \, \forall x \in \mathbb{N}_{[0,\infty)} \\ S_2. \quad & \text{如果} x \leq y \text{且} y \leq z, \text{则} x \leq z \\ S_3. \quad & x=y \text{当且仅当}, x \leq y \text{且} y \leq x \\ S_4. \quad & 0 \leq x \, \forall x \in \mathbb{N}_{[0,\infty)} \\ \end{aligned} S 1 . S 2 . S 3 . S 4 . x ≤ x ∀ x ∈ N [ 0 , ∞ ) 如果 x ≤ y 且 y ≤ z , 则 x ≤ z x = y 当且仅当 , x ≤ y 且 y ≤ x 0 ≤ x ∀ x ∈ N [ 0 , ∞ )
这些法则除了使用不同的符号之外,实质上是 上文S 1 S_1 S 1 到 S 4 S_4 S 4 的镜像。这种相似性并不止步于此。考虑到集合的并、交运算的恒等律、结合律和分配律,可以明显看出它们类似于非负整数 N [ 0 , ∞ ) \mathbb{N}_{[0,\infty)} N [ 0 , ∞ ) 上的加法和乘法法则:
恒等律 :x + 0 = x 和 x × 0 = 0 x + 0 = x \text{和} x × 0 = 0 x + 0 = x 和 x × 0 = 0
结合律 :( x + y ) + z = x + ( y + z ) 和 ( x × y ) × z = x × ( y × z ) (x + y) + z = x + (y + z) \text{和} (x × y) × z = x × (y × z) ( x + y ) + z = x + ( y + z ) 和 ( x × y ) × z = x × ( y × z ) ;
交换律 :x + y = y + x 和 x × y = y × x x + y = y + x \text{和} x × y = y × x x + y = y + x 和 x × y = y × x ;
分配律 :x × ( y + z ) = ( x × y ) + ( x × z ) x × (y + z) = (x × y) + (x × z) x × ( y + z ) = ( x × y ) + ( x × z ) 。
这种相似性将贯穿于本书的全文。
实数集可以通过引入最大元素和最小元素的概念进行扩展。分别称为正无穷和负无穷的符号∞ \infty ∞ 和− ∞ -\infty − ∞ ,可用来以以下三种方式扩展R \mathbb{R} R 设置:
R ∞ = R ∪ { ∞ } R − ∞ = R ∪ { − ∞ } R ± ∞ = R ∞ ∪ R − ∞ = R ∪ { ∞ , − ∞ } R [ 0 , ∞ ] = R [ 0 , ∞ ) ∪ { ∞ } \mathbb{R}_{\infty} = \mathbb{R} \cup \{\infty\} \\ \mathbb{R}_{-\infty} = \mathbb{R} \cup \{-\infty\} \\ \mathbb{R}_{\pm\infty} = \mathbb{R}_{\infty} \cup \mathbb{R}_{-\infty} = \mathbb{R} \cup \{\infty,-\infty\} \\ \mathbb{R}_{[0,\infty]} = \mathbb{R}_{[0,\infty)}\cup \{\infty\} R ∞ = R ∪ { ∞ } R − ∞ = R ∪ { − ∞ } R ± ∞ = R ∞ ∪ R − ∞ = R ∪ { ∞ , − ∞ } R [ 0 , ∞ ] = R [ 0 , ∞ ) ∪ { ∞ }
通过声明∞ \infty ∞ 大于任何实数,− ∞ -\infty − ∞ 小于任何实数,这些集合成为有序集。R [ 0 , ∞ ] \mathbb{R}_{[0,\infty]} R [ 0 , ∞ ] 的子集N [ 0 , ∞ ] \mathbb{N}_{[0,\infty]} N [ 0 , ∞ ] 是通过设置N [ 0 , ∞ ] = N [ 0 , ∞ ) ∪ { ∞ } \mathbb{N}_{[0,\infty]}=\mathbb{N}_{[0,\infty)} \cup \{\infty\} N [ 0 , ∞ ] = N [ 0 , ∞ ) ∪ { ∞ } 来定义的。最后,有理数集和复数集分别用Q \mathbb{Q} Q 和C \mathbb{C} C 表示。
如果对于某个非空集合Λ \Lambda Λ 的每个元素λ \lambda λ 都对应一个集合X λ X_λ X λ ,则集合{ X λ : λ ∈ Λ } \{X_\lambda:\ \lambda \in \Lambda\} { X λ : λ ∈ Λ } 称为集合族,Λ Λ Λ 称为该族的索引集(indexing set) 。这样的索引族通常也用{ X λ } λ ∈ Λ \{X_\lambda\}_{\lambda \in \Lambda} { X λ } λ ∈ Λ 表示。如果索引集Λ = N Λ = \mathbb{N} Λ = N ,则索引族{ X i } i ∈ N \{X_i\}_{i \in \mathbb{N}} { X i } i ∈ N 称为一个序列(集合的序列),也可以用{ X i } i = 1 ∞ \{X_i\}_{i=1}^{\infty} { X i } i = 1 ∞ 表示。
并集和交集的概念可以推广到任意的索引集族,这些集合是全集U U U 的子集。
定义1.3 令{ X λ } λ ∈ Λ \{X_\lambda\}_{\lambda \in \Lambda} { X λ } λ ∈ Λ 是全集U U U 的子集族。该族的并集用⋃ λ ∈ Λ X λ \bigcup_{\lambda \in \Lambda} X_{\lambda} ⋃ λ ∈ Λ X λ 表示,即集合:
{ x ∈ U : 至少存在一个 λ ∈ Λ , 有 x ∈ X λ } \{ x \in U\ :\ \text{至少存在一个} \lambda \in \Lambda, \text{有} x \in X_{\lambda} \} { x ∈ U : 至少存在一个 λ ∈ Λ , 有 x ∈ X λ }
交集用⋂ λ ∈ Λ X λ \bigcap_{\lambda \in \Lambda} X_{\lambda} ⋂ λ ∈ Λ X λ 表示,即集合:
{ x ∈ U : 对任意 λ ∈ Λ , 有 x ∈ X λ } \{ x \in U\ :\ \text{对任意} \lambda \in \Lambda, \text{有} x \in X_{\lambda} \} { x ∈ U : 对任意 λ ∈ Λ , 有 x ∈ X λ }
对于有限和无限序列{ X i } i = 1 n \{X_i\}_{i=1}^n { X i } i = 1 n 和{ X i } i = 1 ∞ \{X_i\}_{i=1}^\infty { X i } i = 1 ∞ ,我们也将使用如下符号:
⋃ i = 1 n X i = X 1 ∪ X 2 ∪ … ∪ X n ⋃ i = 1 ∞ X i = X 1 ∪ X 2 ∪ … ⋂ i = 1 n X i = X 1 ∩ X 2 ∩ … \begin{aligned} \bigcup_{i=1}^n X_i & = X_1 \cup X_2 \cup \ldots \cup X_n \\ \bigcup_{i=1}^{\infty} X_i & = X_1 \cup X_2 \cup \ldots \\ \bigcap_{i=1}^n X_i & = X_1 \cap X_2 \cap \ldots \end{aligned} i = 1 ⋃ n X i i = 1 ⋃ ∞ X i i = 1 ⋂ n X i = X 1 ∪ X 2 ∪ … ∪ X n = X 1 ∪ X 2 ∪ … = X 1 ∩ X 2 ∩ …
示例 1.1 令Λ = { λ : λ ∈ R 且 0 ≤ λ ≤ 1 } \Lambda = \{ \lambda : \lambda \in \mathbb{R} \text{ 且 } 0 \leq \lambda \leq 1 \} Λ = { λ : λ ∈ R 且 0 ≤ λ ≤ 1 } 。对每个λ ∈ Λ \lambda \in \Lambda λ ∈ Λ ,令X λ = { r : r ∈ R , 0 ≤ r ≤ λ } X_\lambda = \{ r : r \in \mathbb{R}, 0 \leq r \leq \lambda \} X λ = { r : r ∈ R , 0 ≤ r ≤ λ } 。那么:
⋃ λ ∈ Λ X λ = { r : r ∈ R , 0 ≤ r ≤ 1 } = Λ \bigcup_{\lambda \in \Lambda} X_\lambda = \{ r : r \in \mathbb{R}, 0 \leq r \leq 1 \} = \Lambda λ ∈ Λ ⋃ X λ = { r : r ∈ R , 0 ≤ r ≤ 1 } = Λ
⋂ λ ∈ Λ X λ = { 0 } \bigcap_{\lambda \in \Lambda} X_\lambda = \{ 0 \} λ ∈ Λ ⋂ X λ = { 0 }
这个例子可以推广为:令X X X 是任意集合,对于每个 x ∈ X x \in X x ∈ X ,令 X x X_x X x 是 X X X 的一个子集,使得 x ∈ X x ⊂ X x \in X_x \subset X x ∈ X x ⊂ X . 那么 X = ⋃ x ∈ X X x X = \bigcup_{x \in X} X_x X = ⋃ x ∈ X X x 。
假设 { A λ } λ ∈ Λ \{ A_\lambda \}_{\lambda \in \Lambda} { A λ } λ ∈ Λ 是一组(以Λ \Lambda Λ 为索引集的) 集合,X X X 是任意集合。那么并集和交集遵循以下等价律:
S 14 . X \ ( ⋃ λ ∈ Λ A λ ) = ⋂ λ ∈ Λ ( X \ A λ ) S 15 . X \ ⋂ λ ∈ Λ A λ ′ = ⋃ λ ∈ Λ ( X \ A λ ) \begin{aligned} S_{14}. \quad & X \backslash (\bigcup_{\lambda \in \Lambda} A_\lambda) = \bigcap_{\lambda \in \Lambda} (X \backslash A_\lambda) \\ S_{15}. \quad & X \backslash \bigcap_{\lambda \in \Lambda} A_\lambda^\prime = \bigcup_{\lambda \in \Lambda} (X \backslash A_\lambda) \\ \end{aligned} S 14 . S 15 . X \ ( λ ∈ Λ ⋃ A λ ) = λ ∈ Λ ⋂ ( X \ A λ ) X \ λ ∈ Λ ⋂ A λ ′ = λ ∈ Λ ⋃ ( X \ A λ )
这些律规在我们对测度论(measure theory)的讨论中发挥了关键作用。
一组集合 { X i } i = 1 n \{ X_i \}_{i=1}^n { X i } i = 1 n 的 n n n 次笛卡尔积可以通过归纳法定义,得到以下形式:
∏ i = 1 n X i = X 1 × X 2 × … × X n = { ( x 1 , x 2 , … , x n ) : x i ∈ X i , i ∈ N } \prod_{i=1}^n X_i = X_1 \times X_2 \times \ldots \times X_n = \{(x_1, x_2, \ldots, x_n) : x_i \in X_i \text{ , } i \in \mathbb{N}\} i = 1 ∏ n X i = X 1 × X 2 × … × X n = {( x 1 , x 2 , … , x n ) : x i ∈ X i , i ∈ N }
其中 x i x_i x i 被称为第 i i i 个坐标。如果 X = X i X = X_i X = X i 对于 i = 1 , … , n i = 1, \ldots, n i = 1 , … , n ,那么我们定义 X n = ∏ i = 1 n X i X^n = \prod_{i=1}^n X_i X n = ∏ i = 1 n X i 。特别地,如果 R = X i \mathbb{R} = X_i R = X i 对于 i = 1 , … , n i = 1, \ldots, n i = 1 , … , n ,那么 n n n 维欧几里得空间由 R n = ∏ i = 1 n R \mathbb{R}^n = \prod_{i=1}^n \mathbb{R} R n = ∏ i = 1 n R 给出。类似地,R ∞ n = ∏ i = 1 n R ∞ \mathbb{R}_{\infty}^{n} = \prod_{i=1}^n \mathbb{R}_{\infty} R ∞ n = ∏ i = 1 n R ∞ ,R − ∞ n = ∏ i = 1 n R − ∞ \mathbb{R}_{-\infty}^{n} = \prod_{i=1}^n \mathbb{R}_{-\infty} R − ∞ n = ∏ i = 1 n R − ∞ ,R ± ∞ n = ∏ i = 1 n R ± ∞ \mathbb{R}_{\pm \infty}^n = \prod_{i=1}^n \mathbb{R}_{\pm \infty} R ± ∞ n = ∏ i = 1 n R ± ∞ 。
习题 1.1.1 设 A = { ( x , y ) : x , y ∈ R 且 3 x + y = 4 } A = \{(x, y) : x, y \in \mathbb{R} \text{ 且 } 3x + y = 4\} A = {( x , y ) : x , y ∈ R 且 3 x + y = 4 } ,以及 B = { ( x , y ) : x , y ∈ R 且 x − 2 y = 2 } B = \{(x, y) : x, y \in \mathbb{R} \text{ 且 } x - 2y = 2\} B = {( x , y ) : x , y ∈ R 且 x − 2 y = 2 } 。确定 A A A 、B B B 、A ∩ B A \cap B A ∩ B 和 A × B A \times B A × B 的图形。 Harry:
A A A 与 B B B 分别是两条直线,A ∩ B A \cap B A ∩ B 是两条直线的交点。
⭕ 比较不好理解的是 A × B A \times B A × B ,按照笛卡尔积定义, A × B = { ( ( x 1 , y 1 ) , ( x 2 , y 2 ) : ( x 1 , y 1 ) ∈ A , ( x 2 , y 2 ) ∈ B ) } A \times B = \{((x_1,y_1),(x_2,y_2) : (x_1,y_1) \in A, (x_2,y_2) \in B)\} A × B = {(( x 1 , y 1 ) , ( x 2 , y 2 ) : ( x 1 , y 1 ) ∈ A , ( x 2 , y 2 ) ∈ B )} 。 这如何在二维空间绘制出来?
⭕ 事实上,A × B A \times B A × B 中的元素是形如 ( x 1 , y 1 , x 2 , y 2 ) (x_1, y_1, x_2, y_2) ( x 1 , y 1 , x 2 , y 2 ) 的四元组,其中 ( x 1 , y 1 ) (x_1, y_1) ( x 1 , y 1 ) 满足 3 x 1 + y 1 = 4 3x_1 + y_1 = 4 3 x 1 + y 1 = 4 ,而 ( x 2 , y 2 ) (x_2, y_2) ( x 2 , y 2 ) 满足 x 2 − 2 y 2 = 2 x_2 - 2y_2 = 2 x 2 − 2 y 2 = 2 。A × B A \times B A × B 的图形可以在四维空间中表示,其中 x 1 , y 1 , x 2 , y 2 x_1, y_1, x_2, y_2 x 1 , y 1 , x 2 , y 2 分别是四个坐标轴。然而,由于我们无法直观地在三维或二维空间中表示四维对象,因此通常我们会采用其他方法来可视化。
在实际应用中,可以通过选择一些特定的值,例如 x 1 = x 2 = 0 x_1 = x_2 = 0 x 1 = x 2 = 0 ,来观察 A × B A \times B A × B 中的一些元素,从而对其性质有一些直观的认识。
证明等价律 S 14 S_{14} S 14 。 Harry:
证明如下:
∀ x , x ∈ X \ ( ⋃ λ ∈ Λ A λ ) ⇒ x ∈ X 且 x ∉ ⋃ λ ∈ Λ A λ ⇒ x ∈ X 且 ( ∀ λ ∈ Λ , x ∉ A λ ) ⇒ ∀ λ ∈ Λ , x ∉ A λ 且 x ∈ X ⇒ ∀ λ ∈ Λ , x ∈ X \ A λ ⇒ x ∈ ⋂ λ ∈ Λ ( X \ A λ ) \begin{aligned} \forall x, x \in X \backslash (\bigcup_{\lambda \in \Lambda} A_\lambda) & \Rightarrow x \in X \text{ 且 } x \notin \bigcup_{\lambda \in \Lambda} A_\lambda \\ & \Rightarrow x \in X \text{ 且 } (\forall \lambda \in \Lambda, x \notin A_\lambda)\\ & \Rightarrow \forall \lambda \in \Lambda, x \notin A_\lambda \text{ 且 } x \in X\\ & \Rightarrow \forall \lambda \in \Lambda, x \in X \backslash A_\lambda \\ & \Rightarrow x \in \bigcap_{\lambda \in \Lambda} (X \backslash A_\lambda ) \end{aligned} ∀ x , x ∈ X \ ( λ ∈ Λ ⋃ A λ ) ⇒ x ∈ X 且 x ∈ / λ ∈ Λ ⋃ A λ ⇒ x ∈ X 且 ( ∀ λ ∈ Λ , x ∈ / A λ ) ⇒ ∀ λ ∈ Λ , x ∈ / A λ 且 x ∈ X ⇒ ∀ λ ∈ Λ , x ∈ X \ A λ ⇒ x ∈ λ ∈ Λ ⋂ ( X \ A λ )
因此有
X \ ( ⋃ λ ∈ Λ A λ ) ⊆ ⋂ λ ∈ Λ ( X \ A λ ) ( 14.1 ) X \backslash (\bigcup_{\lambda \in \Lambda} A_\lambda) \subseteq \bigcap_{\lambda \in \Lambda} (X \backslash A_\lambda) \qquad (14.1) X \ ( λ ∈ Λ ⋃ A λ ) ⊆ λ ∈ Λ ⋂ ( X \ A λ ) ( 14.1 )
另,
∀ x , x ∈ ⋂ λ ∈ Λ ( X \ A λ ) ⇒ ∀ λ ∈ Λ , x ∈ ( X \ A λ ) ⇒ ∀ λ ∈ Λ , x ∈ X 且 x ∉ A λ ⇒ x ∈ X 且 ∀ λ ∈ Λ , x ∉ A λ ⇒ x ∈ X 且 x ∉ ⋃ λ ∈ Λ A λ ⇒ x ∈ X \ ⋃ λ ∈ Λ A λ \begin{aligned} \forall x, x \in \bigcap_{\lambda \in \Lambda} (X \backslash A_\lambda ) & \Rightarrow \forall \lambda \in \Lambda, x \in (X \backslash A_\lambda)\\ & \Rightarrow \forall \lambda \in \Lambda, x \in X \text{ 且 } x \notin A_\lambda\\ & \Rightarrow x \in X \text{ 且 } \forall \lambda \in \Lambda,x \notin A_\lambda\\ & \Rightarrow x \in X \text{ 且 } x \notin \bigcup_{\lambda \in \Lambda}A_\lambda\\ & \Rightarrow x \in X \backslash \bigcup_{\lambda \in \Lambda}A_\lambda\\ \end{aligned} ∀ x , x ∈ λ ∈ Λ ⋂ ( X \ A λ ) ⇒ ∀ λ ∈ Λ , x ∈ ( X \ A λ ) ⇒ ∀ λ ∈ Λ , x ∈ X 且 x ∈ / A λ ⇒ x ∈ X 且 ∀ λ ∈ Λ , x ∈ / A λ ⇒ x ∈ X 且 x ∈ / λ ∈ Λ ⋃ A λ ⇒ x ∈ X \ λ ∈ Λ ⋃ A λ
因此有
⋂ λ ∈ Λ ( X \ A λ ) ⊆ X \ ( ⋃ λ ∈ Λ A λ ) ( 14.2 ) \bigcap_{\lambda \in \Lambda} (X \backslash A_\lambda) \subseteq X \backslash (\bigcup_{\lambda \in \Lambda} A_\lambda) \qquad (14.2) λ ∈ Λ ⋂ ( X \ A λ ) ⊆ X \ ( λ ∈ Λ ⋃ A λ ) ( 14.2 )
由 14.1, 14.2可得
X \ ( ⋃ λ ∈ Λ A λ ) = ⋂ λ ∈ Λ ( X \ A λ ) X \backslash (\bigcup_{\lambda \in \Lambda} A_\lambda) = \bigcap_{\lambda \in \Lambda} (X \backslash A_\lambda) X \ ( λ ∈ Λ ⋃ A λ ) = λ ∈ Λ ⋂ ( X \ A λ )
故,S 14 S_{14} S 14 得证
1.1.2 函数 函数或映射的概念在所有数学中都是基础的。直观地说,从集合 X X X 到集合 Y Y Y 的函数 f f f ,表示为 f : X → Y f : X \to Y f : X → Y ,是一种规则,它将 X X X 中的每个元素 x x x 分配给 Y Y Y 中的某个元素 y y y ,其中规则 f f f 对 x x x 到 y y y 的分配表示为 f ( x ) = y f(x) = y f ( x ) = y 。然而,我们将根据集合 的术语正式定义函数的概念。
定义 1.4 设 X X X 和 Y Y Y 是两个集合。从 X X X 到 Y Y Y 的函数 f f f ,表示为 f : X → Y f : X \to Y f : X → Y ,是满足性质的 X × Y X \times Y X × Y 的子集 f ⊆ X × Y f \subseteq X \times Y f ⊆ X × Y :对于每个 x ∈ X x \in X x ∈ X 存在 y ∈ Y y \in Y y ∈ Y 使得 ( x , y ) ∈ f (x, y) \in f ( x , y ) ∈ f 。所有从 X X X 到 Y Y Y 的函数的集合将被表示为 Y X Y^X Y X 。因此,Y X = { f : f Y^X = \{f : f Y X = { f : f 是从 X X X 到 Y Y Y 的函数}。函数也称为映射 。
我们用f ( x ) = y f(x) = y f ( x ) = y 表示 ( x , y ) ∈ f (x, y) \in f ( x , y ) ∈ f ,并说 y y y 是 f f f 在 x x x 处的取值,或者说 y y y 是 f f f 在 x x x 处的求值。例如,定义 X = Y = N X = Y = \mathbb{N} X = Y = N ,那么由以下规则定义的 f ⊆ X × Y f \subseteq X \times Y f ⊆ X × Y 集合:
f = { ( x , y ) : y = 2 x + 1 , x ∈ X } f = \{(x, y) : y = 2x + 1, x \in X\} f = {( x , y ) : y = 2 x + 1 , x ∈ X }
或者等价地,
f = { ( x , 2 x + 1 ) : x ∈ X } f = \{(x, 2x + 1) : x \in X\} f = {( x , 2 x + 1 ) : x ∈ X }
表示一个函数 f : X → Y f : X \to Y f : X → Y 。这个函数由规则 f ( x ) = 2 x + 1 f(x) = 2x + 1 f ( x ) = 2 x + 1 或等价地由 y = 2 x + 1 y = 2x + 1 y = 2 x + 1 完全确定。
我们将定期提到一些特殊属性和类型的函数。区分以下类型的函数是特别重要的:
f 1 f_1 f 1 :如果 f : X → Y f : X \to Y f : X → Y ,f ( x ) ≠ f ( z ) f(x) \neq f(z) f ( x ) = f ( z ) 当且仅当 x ≠ z x \neq z x = z 。 或等价地,f ( x ) = f ( z ) ⇒ x = z f(x) = f(z) \Rightarrow x = z f ( x ) = f ( z ) ⇒ x = z ,则称函数 f f f 是 单射(injective) 或 一一对应(one-to-one) 的。Harry:
显然,函数f ( x ) = x f(x) = x f ( x ) = x 是单射,而f ( x ) = x 2 f(x)= x^2 f ( x ) = x 2 则不是单射,因为f ( − 1 ) = 1 = f ( 1 ) f(-1)=1=f(1) f ( − 1 ) = 1 = f ( 1 ) ,而− 1 ≠ 1 -1 \neq 1 − 1 = 1
f 2 f_2 f 2 :如果 f : X → Y f : X \to Y f : X → Y ,当且仅当每个 y y y 都存在 X X X 中的 x x x 使得 f ( x ) = y f(x) = y f ( x ) = y 时,即 ∀ y ∈ Y , ∃ x ∈ X ∋ f ( x ) = y \forall y \in Y, \exist x \in X \ni f(x)=y ∀ y ∈ Y , ∃ x ∈ X ∋ f ( x ) = y ,则称函数 f f f 是 满射(surjective 或 onto) 。Harry:
函数f : R → R , f ( x ) = x 2 f: \mathbb{R} \to \mathbb{R},f(x) = x^2 f : R → R , f ( x ) = x 2 是满射,而f : N → N , f ( x ) = x 2 f: \mathbb{N} \to \mathbb{N},f(x)=x^2 f : N → N , f ( x ) = x 2 则不是满射
f 3 f_3 f 3 :如果函数 f : X → Y f : X \to Y f : X → Y 同时是单射和满射的,则称其为双射。Harry:
以下是各种映射的图示
例如,函数f ( x ) = x , x ∈ R f(x) = x, x \in \mathbb{R} f ( x ) = x , x ∈ R 是双射
f 4 f_4 f 4 :具有性质 f ( x ) = x , ∀ x ∈ X f(x) = x, \forall x \in X f ( x ) = x , ∀ x ∈ X 的函数 f : X → X f : X \to X f : X → X 称为恒等函数。Harry:
例如,函数f : R → R , f ( x ) = x f:\mathbb{R} \to \mathbb{R},f(x) = x f : R → R , f ( x ) = x 是恒等函数,记作1 R 1_\mathbb{R} 1 R
f 5 f_5 f 5 :当且仅当对于某个 y ∈ Y y \in Y y ∈ Y ,有 f ( x ) = y , ∀ x ∈ X f(x) = y, \forall x \in X f ( x ) = y , ∀ x ∈ X 时,则称函数 f f f 为常函数。Harry:
公式表达为 ∀ x ∈ X , ∃ y ∈ Y , f ( x ) = y \forall x \in X, \exist y \in Y, f(x)=y ∀ x ∈ X , ∃ y ∈ Y , f ( x ) = y
例如 f : R t o R , f ( x ) = 0 f:\mathbb{R} \ to \mathbb{R}, f(x)=0 f : R t o R , f ( x ) = 0
f 6 f_6 f 6 :给定函数 f : X → Y f : X \to Y f : X → Y 和 W ⊆ X W \subseteq X W ⊆ X ,则定义在 W W W 上的函数 f ∣ W : W → Y f\vert_W : W \to Y f ∣ W : W → Y ,由 f ∣ W = f ∩ ( W × Y ) = { ( x , f ( x ) ) : x ∈ W } f\vert_W = f \cap (W \times Y) = \{(x, f(x)) : x \in W\} f ∣ W = f ∩ ( W × Y ) = {( x , f ( x )) : x ∈ W } ,称为 f f f 对 W W W 的限制(restriction) 。Harry:
公式表达为 ∀ x ∈ X , ∃ y ∈ Y , f ( x ) = y \forall x \in X, \exist y \in Y, f(x)=y ∀ x ∈ X , ∃ y ∈ Y , f ( x ) = y
例如 f : R → R , f ( x ) = 0 f:\mathbb{R} \to \mathbb{R}, f(x)=0 f : R → R , f ( x ) = 0
f 7 f_7 f 7 :给定集合 X 1 , … , X n X_1, \ldots, X_n X 1 , … , X n ,对于 1 ≤ j ≤ n 1 \leq j \leq n 1 ≤ j ≤ n ,由 p j : ∏ i = 1 n X i → X j p_j : \prod_{i=1}^{n} X_i \to X_j p j : ∏ i = 1 n X i → X j 定义的函数,其中 p j ( x 1 , … , x j , … , x n ) = x j p_j(x_1, \ldots, x_j, \ldots, x_n) = x_j p j ( x 1 , … , x j , … , x n ) = x j 称为投影到第 j j j 个坐标。Harry:
例如:p 1 : X × Y × Z → X , g 1 ( x , y , z ) = x p_1: X \times Y \times Z \to X, g_1(x,y,z)=x p 1 : X × Y × Z → X , g 1 ( x , y , z ) = x
f 8 f_8 f 8 :对于 X ⊆ U X \subseteq U X ⊆ U ,由 χ X : U → { 0 , 1 } \chi_X : U \to \{0, 1\} χ X : U → { 0 , 1 } 定义的函数,χ X ( x ) = { 1 如果 x ∈ X 0 如果 x ∉ X \chi_X(x) = \begin{cases} 1 & \text{如果} \ x \in X \\ 0 & \text{如果} \ x \notin X \end{cases} χ X ( x ) = { 1 0 如果 x ∈ X 如果 x ∈ / X
\qquad 称为集合 X X X 的特征函数。
f 4 f_4 f 4 定义的恒等函数通常表示为 1 X 1_X 1 X 。
请注意,两个函数 f : X → Y f: X \to Y f : X → Y 和 g : Y → Z g: Y \to Z g : Y → Z 的复合函数是一个函数 g ∘ f : X → Z g \circ f: X \to Z g ∘ f : X → Z ,由 ( g ∘ f ) ( x ) = g [ f ( x ) ] , ∀ x ∈ X (g \circ f)(x) = g[f(x)], \ \forall x \in X ( g ∘ f ) ( x ) = g [ f ( x )] , ∀ x ∈ X 定义。下面的定理说明了建立给定函数 f f f (或 g g g )是一对一(或满射)的简单方法。
定理1.3 令 f : X → Y f: X \to Y f : X → Y , g : Y → X g: Y \to X g : Y → X , 以及 h : Y → Z h: Y \to Z h : Y → Z 。
如果 g ∘ f = 1 X g \circ f = 1_X g ∘ f = 1 X , 那么 f f f 是单射的,而 g g g 是满射的。 如果 f f f 和 h h h 是满射的,那么 h ∘ f : X → Z h \circ f: X \to Z h ∘ f : X → Z 也是满射的。 如果 f f f 和 h h h 是单射的,那么 h ∘ f : X → Z h \circ f: X \to Z h ∘ f : X → Z 也是单射的。 证明。我们只证明定理的第1部分,将剩余的部分留作习题。
由于
f ( x ) = f ( z ) ⇒ x = ( g ∘ f ) ( x ) = g ( f ( x ) ) = g ( f ( z ) ) = ( g ∘ f ) ( z ) = z f(x) = f(z) \Rightarrow x = (g \circ f)(x) = g(f(x)) = g(f(z)) = (g \circ f)(z) = z f ( x ) = f ( z ) ⇒ x = ( g ∘ f ) ( x ) = g ( f ( x )) = g ( f ( z )) = ( g ∘ f ) ( z ) = z
我们得知 f f f 是单射的。
又由于
∀ x ∈ X , ∃ y ∈ Y , y = f ( x ) ⇒ x = ( g ∘ f ) ( x ) = g ( f ( x ) ) = g ( y ) \forall x \in X, \ \exists y \in Y, y = f(x) \Rightarrow x = (g \circ f)(x) = g(f(x)) = g(y) ∀ x ∈ X , ∃ y ∈ Y , y = f ( x ) ⇒ x = ( g ∘ f ) ( x ) = g ( f ( x )) = g ( y )
所以 g g g 是满射的。□ \Box □
在定理1.3 证明的最后一句话后面是 Halmos 符号 □ \Box □ 。这个符号代表拉丁短语 "Q.E.D"(“quod erat demonstrandum”的缩写),意为“即所证明的”,在本文末尾的定理证明中将会经常使用。
Harry:
Halmos符号是数学家Paul Halmos提出的一个数学符号。
Paul Halmos是一位20世纪的数学家,他提倡使用这个符号来标记证明的结束,以增加数学文献的清晰度。虽然这个符号的使用并非普遍规范,但在许多数学文献中都可以看到。
我们展示一个定理1.3的简单示例。对于任意函数 h : X → Z h: X \to Z h : X → Z 和函数 f : X → Y f: X \to Y f : X → Y ,其中 Y = X × Z Y = X \times Z Y = X × Z 且 f ( x ) = ( x , h ( x ) ) f(x) = (x, h(x)) f ( x ) = ( x , h ( x )) 是单射的。设 p 1 : X × Y → X p_1: X \times Y \to X p 1 : X × Y → X 是到第一个坐标的投影。那么 p 1 ∘ f : X → X p_1 \circ f: X \to X p 1 ∘ f : X → X 是 1 X 1_X 1 X 。因此,根据定理1.3,f f f 是单射的(且 p 1 p_1 p 1 是满射的)。
Harry:
\quad 对于任意函数h : X → Z h: X \to Z h : X → Z 和函数 f : X → Y f: X \to Y f : X → Y ,其中 Y = X × Z Y = X \times Z Y = X × Z 且 f ( x ) = ( x , h ( x ) ) f(x) = (x, h(x)) f ( x ) = ( x , h ( x )) 是单射的。
\quad 为什么要定义f f f 是单射?这不是想利用定理1.3推出的结论吗?
我们可以另外给一个例子:假设 X = Z = N X=Z=\mathbb{N} X = Z = N ,对∀ x , y ∈ N \forall x, y \in \mathbb{N} ∀ x , y ∈ N ,有f ( x ) = ( x , x + 1 ) f(x) = (x, x+1) f ( x ) = ( x , x + 1 ) , g ( x , y ) = x g(x,y)=x g ( x , y ) = x ,则g ∘ f ( x ) = g ( x , x + 1 ) = x g \circ f (x) = g (x,x+1) = x g ∘ f ( x ) = g ( x , x + 1 ) = x ,即g ∘ f = 1 X g \circ f = 1_X g ∘ f = 1 X ,则显然f f f 是单射(∵ ( x 1 , x 1 + 1 ) = ( x 2 , x 2 + 1 ) ⇒ x 1 = x 2 \because (x_1,x_1+1)=(x_2,x_2+1) \Rightarrow x_1=x_2 ∵ ( x 1 , x 1 + 1 ) = ( x 2 , x 2 + 1 ) ⇒ x 1 = x 2 ),而g g g 确实是满射。 定义 1.5 假设 f : X → Y f: X \to Y f : X → Y ,A ⊂ X A \subset X A ⊂ X ,B ⊂ Y B \subset Y B ⊂ Y 。那么:
函数 f f f 的值域(range)是集合 R ( f ) = { f ( x ) : x ∈ X } R(f) = \{f(x) : x \in X\} R ( f ) = { f ( x ) : x ∈ X } ; 集合 A A A 的像是集合 f ( A ) = { y : y = f ( x ) , x ∈ A } f(A) = \{y : y = f(x), x \in A\} f ( A ) = { y : y = f ( x ) , x ∈ A } ; 集合 B B B 的原像(pre-image)是集合 f − 1 ( B ) = { x : f ( x ) ∈ B } f^{-1}(B) = \{x : f(x) \in B\} f − 1 ( B ) = { x : f ( x ) ∈ B } 。 函数 f : X → Y f: X \to Y f : X → Y 的定义域(domain)是集合 X X X 。原像也被称为逆像。这些定义的直接结果是 f − 1 ( R ( f ) ) = X f^{-1}(R(f)) = X f − 1 ( R ( f )) = X ,R ( f ) ⊂ Y R(f) \subset Y R ( f ) ⊂ Y ,且 R ( f ) = Y ⇔ f 是满射 R(f) = Y \Leftrightarrow f \text{是满射} R ( f ) = Y ⇔ f 是满射 。此外,当B ≠ ∅ B \neq \varnothing B = ∅ ,f − 1 ( B ) f^{-1}(B) f − 1 ( B ) 也可能为空。
Harry:
设函数f : R → R f: ℝ → ℝ f : R → R ,其中f ( x ) = x 2 f(x) = x^2 f ( x ) = x 2 。有集合B = { y : y ∈ R , y < 0 } B = \{y : y ∈ ℝ , y < 0\} B = { y : y ∈ R , y < 0 } ,即所有负实数的集合。在这种情况下,f − 1 ( B ) f^{−1}(B) f − 1 ( B ) 将为空集,因为平方根函数的定义域是非负实数。所以,尽管B ≠ ∅ B ≠ \varnothing B = ∅ ,但f − 1 ( B ) f^{−1}(B) f − 1 ( B ) 可能为空。
原像的概念引出了一个函数 f − 1 : 2 Y → 2 X f^{-1}: 2^Y \to 2^X f − 1 : 2 Y → 2 X ,其定义为 f − 1 ( B ) ∈ 2 X , ∀ B ∈ 2 Y f^{-1}(B) \in 2^X, \forall B \in 2^Y f − 1 ( B ) ∈ 2 X , ∀ B ∈ 2 Y 。类似地,函数f f f 引出的函数2 X → 2 Y 2^X \to 2^Y 2 X → 2 Y 也被表示为 f f f ,其定义为 f ( A ) ∈ 2 Y , ∀ A ∈ 2 X f(A) \in 2^Y, \forall A \in 2^X f ( A ) ∈ 2 Y , ∀ A ∈ 2 X ,其中 f ( ∅ ) = ∅ f(\varnothing) = \varnothing f ( ∅ ) = ∅ 。这两个引出的函数被称为集合函数,因为它们将集合映射到集合。我们通过列举一些集合函数的基本属性来结束本节。这里列出的许多属性将在后面的章节中以类似的形式周期性地出现。
Harry:
2 X 2^X 2 X 是X X X 的幂集,2 Y 2^Y 2 Y 是Y Y Y 的幂集
定理 1.4 令 f : X → Y f: X \to Y f : X → Y ,A ⊂ B ⊂ X A \subset B \subset X A ⊂ B ⊂ X ,且{ A λ } λ ∈ Λ \{A_\lambda\}_{\lambda \in \Lambda} { A λ } λ ∈ Λ 是 X X X 的子集族。那么:
f ( A ) ⊂ f ( B ) f(A) \subset f(B) f ( A ) ⊂ f ( B ) f ( ⋃ λ ∈ Λ A λ ) = ⋃ λ ∈ Λ f ( A λ ) f(\bigcup_{\lambda \in \Lambda} A_\lambda) = \bigcup_{\lambda \in \Lambda} f(A_\lambda) f ( ⋃ λ ∈ Λ A λ ) = ⋃ λ ∈ Λ f ( A λ ) f ( ⋂ λ ∈ Λ A λ ) ⊂ ⋂ λ ∈ Λ f ( A λ ) f(\bigcap_{\lambda \in \Lambda} A_\lambda) \subset \bigcap_{\lambda \in \Lambda} f(A_\lambda) f ( ⋂ λ ∈ Λ A λ ) ⊂ ⋂ λ ∈ Λ f ( A λ ) 如果 A ⊂ B ⊂ Y A \subset B \subset Y A ⊂ B ⊂ Y ,{ B λ } λ ∈ Λ \{B_\lambda\}_{\lambda \in \Lambda} { B λ } λ ∈ Λ 是 Y Y Y 的子集族。那么:
f − 1 ( A ) ⊂ f − 1 ( B ) f^{-1}(A) \subset f^{-1}(B) f − 1 ( A ) ⊂ f − 1 ( B ) f − 1 ( B ′ ) ⊂ ( f − 1 ( B ) ) ′ f^{-1}(B') \subset (f^{-1}(B))' f − 1 ( B ′ ) ⊂ ( f − 1 ( B ) ) ′ f − 1 ( ⋃ λ ∈ Λ B λ ) = ⋃ λ ∈ Λ f − 1 ( B λ ) f^{-1}(\bigcup_{\lambda \in \Lambda} B_\lambda) = \bigcup_{\lambda \in \Lambda} f^{-1}(B_\lambda) f − 1 ( ⋃ λ ∈ Λ B λ ) = ⋃ λ ∈ Λ f − 1 ( B λ ) f − 1 ( ⋂ λ ∈ Λ B λ ) = ⋂ λ ∈ Λ f − 1 ( B λ ) f^{-1}(\bigcap_{\lambda \in \Lambda} B_\lambda) = \bigcap_{\lambda \in \Lambda} f^{-1}(B_\lambda) f − 1 ( ⋂ λ ∈ Λ B λ ) = ⋂ λ ∈ Λ f − 1 ( B λ ) 证明:我们只证明性质 7,因为性质 1 到性质 6 的证明同样简单。注意到:
x ∈ f − 1 ( ⋂ λ ∈ Λ B λ ) ⇔ f ( x ) ∈ ⋂ λ ∈ Λ B λ ⇔ f ( x ) ∈ B λ ∀ λ ∈ Λ ⇔ x ∈ f − 1 ( B λ ) ∀ λ ∈ Λ ⇔ x ∈ ⋂ λ ∈ Λ f − 1 ( B λ ) □ \begin{aligned} x \in f^{-1}(\bigcap_{\lambda \in \Lambda} B_\lambda) & \Leftrightarrow f(x) \in \bigcap_{\lambda \in \Lambda} B_{\lambda} \\ & \Leftrightarrow f(x) \in B_{\lambda} \quad \forall \lambda \in \Lambda \\ & \Leftrightarrow x \in f^{-1}(B_{\lambda}) \quad \forall \lambda \in \Lambda \\ & \Leftrightarrow x \in \bigcap_{\lambda \in \Lambda} f^{-1}(B_\lambda) \qquad \Box \end{aligned} x ∈ f − 1 ( λ ∈ Λ ⋂ B λ ) ⇔ f ( x ) ∈ λ ∈ Λ ⋂ B λ ⇔ f ( x ) ∈ B λ ∀ λ ∈ Λ ⇔ x ∈ f − 1 ( B λ ) ∀ λ ∈ Λ ⇔ x ∈ λ ∈ Λ ⋂ f − 1 ( B λ ) □
以上关系证明了 f − 1 ( ⋂ λ ∈ Λ B λ ) ⊂ ⋂ λ ∈ Λ f − 1 ( B λ ) f^{-1}(\bigcap_{\lambda \in \Lambda} B_\lambda) \subset \bigcap_{\lambda \in \Lambda} f^{-1}(B_\lambda) f − 1 ( ⋂ λ ∈ Λ B λ ) ⊂ ⋂ λ ∈ Λ f − 1 ( B λ ) 。
Harry:
⭕ 这只能证明f − 1 ( ⋂ λ ∈ Λ B λ ) ⊆ ⋂ λ ∈ Λ f − 1 ( B λ ) f^{-1}(\bigcap_{\lambda \in \Lambda} B_\lambda) \subseteq \bigcap_{\lambda \in \Lambda} f^{-1}(B_\lambda) f − 1 ( ⋂ λ ∈ Λ B λ ) ⊆ ⋂ λ ∈ Λ f − 1 ( B λ ) ,而不是 ⊂ \subset ⊂
关于两个集合函数之间的重要关系也很容易验证:
定理 1.5 设 f : X → Y f: X \to Y f : X → Y ,A ⊂ X A \subset X A ⊂ X ,B ⊂ Y B \subset Y B ⊂ Y 。那么:
A ⊂ f − 1 ∘ f ( A ) A \subset f^{-1} \circ f(A) A ⊂ f − 1 ∘ f ( A ) f ∘ f − 1 ( B ) ⊂ B f \circ f^{-1}(B) \subset B f ∘ f − 1 ( B ) ⊂ B 下面的例子说明了定理 1.4 中的推论 (3) 和定理 1.5 中的包含关系通常不能被等式替代。
例 1.2 设 A = { ( x , y ) : 1 ≤ x ≤ 2 , 1 ≤ y ≤ 2 } A = \{(x, y) : 1 \leq x \leq 2, 1 \leq y \leq 2\} A = {( x , y ) : 1 ≤ x ≤ 2 , 1 ≤ y ≤ 2 } ,B = { ( x , y ) : 1 ≤ x ≤ 2 , 3 ≤ y ≤ 4 } B = \{(x, y) : 1 \leq x \leq 2, 3 \leq y \leq 4\} B = {( x , y ) : 1 ≤ x ≤ 2 , 3 ≤ y ≤ 4 } ,p 1 : R × R → R p_1 : \mathbb{R} \times \mathbb{R} \to \mathbb{R} p 1 : R × R → R 是到第一个坐标(即 x x x 轴)的投影。由于 A ∩ B = ∅ A \cap B = \varnothing A ∩ B = ∅ ,所以
p 1 ( A ∩ B ) = ∅ ≠ { x : 1 ≤ x ≤ 2 } = p 1 ( A ) ∩ p 1 ( B ) p_1(A \cap B) = \varnothing \neq \{x : 1 \leq x \leq 2 \}=p_1(A) \cap p_1(B) p 1 ( A ∩ B ) = ∅ = { x : 1 ≤ x ≤ 2 } = p 1 ( A ) ∩ p 1 ( B )
此外,
A ≠ p 1 − 1 ( p 1 ( A ) ) = p 1 − 1 ( { x : 1 ≤ x ≤ 2 } ) = { ( x , y ) : 1 ≤ x ≤ 2 , − ∞ < y < ∞ } A \neq p_1^{-1}(p_1(A)) = p_1^{-1}( \{x : 1 \leq x \leq 2\} ) = \{(x, y) : 1 \leq x \leq 2, -\infty < y < \infty\} A = p 1 − 1 ( p 1 ( A )) = p 1 − 1 ({ x : 1 ≤ x ≤ 2 }) = {( x , y ) : 1 ≤ x ≤ 2 , − ∞ < y < ∞ }
如果 f : X → Y f: X \to Y f : X → Y 是双射,那么对于所有 y ∈ Y y \in Y y ∈ Y ,集合 f − 1 ( { y } ) f^{-1}(\{y\}) f − 1 ({ y }) 包含单个元素 x ∈ X x \in X x ∈ X ,使得 { x } = f − 1 ( { y } ) \{x\} = f^{-1}(\{y\}) { x } = f − 1 ({ y }) 。因此,集合函数 f − 1 f^{-1} f − 1 定义了从 Y Y Y 到 X X X 的双射,记作 f − 1 f^{-1} f − 1 ,定义为 f − 1 ( y ) = f − 1 ( { y } ) f^{-1}(y) = f^{-1}(\{y\}) f − 1 ( y ) = f − 1 ({ y }) 。在这种情况下,我们有 ( f − 1 ) − 1 = f (f^{-1})^{-1} = f ( f − 1 ) − 1 = f ,该等式对定理 1.5 的性质(1)和(2)都成立。此外,如果 g : Y → Z g : Y \to Z g : Y → Z 也是双射,那么 f ∘ g f \circ g f ∘ g 和 ( g ∘ f ) − 1 (g \circ f)^{-1} ( g ∘ f ) − 1 都是双射。这来自于定理 1.3 以及事实 ( g ∘ f ) − 1 = f − 1 ∘ g − 1 (g \circ f)^{-1} = f^{-1} \circ g^{-1} ( g ∘ f ) − 1 = f − 1 ∘ g − 1 。
习题 1.1.2 证明定理 1.3 的第 2 部分和第 3 部分。 Harry:
先证定理1.3的第2部分,即h ∘ f : X → Z h \circ f: X \to Z h ∘ f : X → Z 也是满射。
∀ z ∈ Z , z = h ∘ f ⇒ ∃ y ∈ Y , z = h ( y ) , y = f ( ∵ h 是满射 ) ⇒ ∃ x ∈ X , y = f ( x ) ( ∵ f 是满射 ) \begin{aligned} \forall z \in Z, z = h \circ f & \Rightarrow \exist y \in Y, z= h(y), y=f \qquad (\because h\text{是满射})\\ & \Rightarrow \exist x \in X , y=f(x)\qquad (\because f\text{是满射}) \\ \end{aligned} ∀ z ∈ Z , z = h ∘ f ⇒ ∃ y ∈ Y , z = h ( y ) , y = f ( ∵ h 是满射 ) ⇒ ∃ x ∈ X , y = f ( x ) ( ∵ f 是满射 )
即
∀ z ∈ Z , z = h ∘ f ⇒ ∃ x ∈ X , h ∘ f ( x ) = z \forall z \in Z, z = h \circ f \Rightarrow \exist x \in X, h\circ f(x) = z ∀ z ∈ Z , z = h ∘ f ⇒ ∃ x ∈ X , h ∘ f ( x ) = z
故h ∘ f : X → Z h \circ f: X \to Z h ∘ f : X → Z 是满射 □ \Box □
现在证第3部分,即对于单射函数h h h 和f f f ,其复合函数h ∘ f : X → Z h \circ f: X \to Z h ∘ f : X → Z 也是单射。
∀ x , z ∈ Z , h ∘ f ( x ) = h ∘ f ( z ) ⇒ f ( x ) = f ( z ) ( ∵ h 是单射 ) ⇒ x = z ( ∵ f 是单射 ) \begin{aligned} \forall x, z \in Z, h \circ f(x) = h \circ f(z) & \Rightarrow f(x) = f(z) \qquad (\because h\text{是单射})\\ & \Rightarrow x=z \qquad (\because f\text{是单射}) \\ \end{aligned} ∀ x , z ∈ Z , h ∘ f ( x ) = h ∘ f ( z ) ⇒ f ( x ) = f ( z ) ( ∵ h 是单射 ) ⇒ x = z ( ∵ f 是单射 )
即
∀ x , z ∈ Z , h ∘ f ( x ) = h ∘ f ( z ) ⇒ x = z \forall x,z \in Z,h \circ f(x) = h \circ f(z) \Rightarrow x=z ∀ x , z ∈ Z , h ∘ f ( x ) = h ∘ f ( z ) ⇒ x = z
故h ∘ f : X → Z h \circ f: X \to Z h ∘ f : X → Z 是单射 □ \Box □
证明定理 1.4 的第 1、2、3 部分。 Harry:
先证第1部分。
首先使用反证法先证明 f ( A ) ⊆ f ( B ) f(A) \subseteq f(B) f ( A ) ⊆ f ( B ) :
f ( A ) ⊈ f ( B ) ⇒ ∃ x ∈ A , f ( x ) ∈ f ( A ) , f ( x ) ∉ f ( B ) ⇒ x ∈ B , f ( x ) ∉ f ( B ) \begin{aligned} f(A) \nsubseteq f(B) & \Rightarrow \exist x \in A, f(x) \in f(A), f(x) \notin f(B) \\ & \Rightarrow x \in B, f(x) \notin f(B)\\ \end{aligned} f ( A ) ⊈ f ( B ) ⇒ ∃ x ∈ A , f ( x ) ∈ f ( A ) , f ( x ) ∈ / f ( B ) ⇒ x ∈ B , f ( x ) ∈ / f ( B )
显然以上结论自相矛盾,因此f ( A ) ⊆ f ( B ) f(A) \subseteq f(B) f ( A ) ⊆ f ( B )
然后证明f ( A ) ≠ f ( B ) f(A) \neq f(B) f ( A ) = f ( B )
A ⊂ B ⇒ ∃ x ∈ A , x ∉ B ⇒ f ( x ) ∈ f ( A ) , f ( x ) ∉ f ( B ) ⇒ f ( A ) ≠ f ( B ) \begin{aligned} A \subset B & \Rightarrow \exist x \in A, x \notin B \\ & \Rightarrow f(x) \in f(A), f(x) \notin f(B)\\ & \Rightarrow f(A) \neq f(B) \end{aligned} A ⊂ B ⇒ ∃ x ∈ A , x ∈ / B ⇒ f ( x ) ∈ f ( A ) , f ( x ) ∈ / f ( B ) ⇒ f ( A ) = f ( B )
综上, f ( A ) ⊂ f ( B ) f(A) \subset f(B) f ( A ) ⊂ f ( B ) 得证 □ \qquad \Box □
再证第2部分。
f ( x ) ∈ f ( ⋃ λ ∈ Λ A λ ) ⇔ x ∈ ⋃ λ ∈ Λ A λ ⇔ x ∈ A λ , ∃ λ ∈ Λ ⇔ f ( x ) ∈ f ( A λ ) , ∃ λ ∈ Λ ⇔ f ( x ) ∈ ⋃ λ ∈ Λ f ( A λ ) \begin{aligned} f(x) \in f(\bigcup_{\lambda \in \Lambda}A_\lambda) & \Leftrightarrow x \in \bigcup_{\lambda \in \Lambda}A_\lambda \\ & \Leftrightarrow x \in A_\lambda, \ \exist \lambda \in \Lambda \\ & \Leftrightarrow f(x) \in f(A_\lambda), \ \exist \lambda \in \Lambda \\ & \Leftrightarrow f(x) \in \bigcup_{\lambda \in \Lambda}f(A_\lambda) \\ \end{aligned} f ( x ) ∈ f ( λ ∈ Λ ⋃ A λ ) ⇔ x ∈ λ ∈ Λ ⋃ A λ ⇔ x ∈ A λ , ∃ λ ∈ Λ ⇔ f ( x ) ∈ f ( A λ ) , ∃ λ ∈ Λ ⇔ f ( x ) ∈ λ ∈ Λ ⋃ f ( A λ )
故,f ( ⋃ λ ∈ Λ A λ ) = ⋃ λ ∈ Λ f ( A λ ) f(\bigcup_{\lambda \in \Lambda}A_\lambda)=\bigcup_{\lambda \in \Lambda}f(A_\lambda) f ( ⋃ λ ∈ Λ A λ ) = ⋃ λ ∈ Λ f ( A λ ) 得证 □ \qquad \Box □
再证第3部分。
f ( x ) ∈ f ( ⋂ λ ∈ Λ A λ ) ⇒ x ∈ ⋂ λ ∈ Λ A λ ⇒ x ∈ A λ , ∀ λ ∈ Λ ⇒ f ( x ) ∈ f ( A λ ) , ∀ λ ∈ Λ ⇒ f ( x ) ∈ ⋂ λ ∈ Λ f ( A λ ) \begin{aligned} f(x) \in f(\bigcap_{\lambda \in \Lambda}A_\lambda) & \Rightarrow x \in \bigcap_{\lambda \in \Lambda}A_\lambda \\ & \Rightarrow x \in A_\lambda, \ \forall \lambda \in \Lambda \\ & \Rightarrow f(x) \in f(A_\lambda), \ \forall \lambda \in \Lambda \\ & \Rightarrow f(x) \in \bigcap_{\lambda \in \Lambda}f(A_\lambda) \\ \end{aligned} f ( x ) ∈ f ( λ ∈ Λ ⋂ A λ ) ⇒ x ∈ λ ∈ Λ ⋂ A λ ⇒ x ∈ A λ , ∀ λ ∈ Λ ⇒ f ( x ) ∈ f ( A λ ) , ∀ λ ∈ Λ ⇒ f ( x ) ∈ λ ∈ Λ ⋂ f ( A λ )
故,f ( ⋂ λ ∈ Λ A λ ) ⊆ ⋂ λ ∈ Λ f ( A λ ) f(\bigcap_{\lambda \in \Lambda}A_\lambda) \subseteq \bigcap_{\lambda \in \Lambda}f(A_\lambda) f ( ⋂ λ ∈ Λ A λ ) ⊆ ⋂ λ ∈ Λ f ( A λ ) 得证 □ \qquad \Box □
证明定理 1.4 的第 4、5、6 部分。 Harry:
先证第4部分:
x ∈ f − 1 ( A ) ⇒ f ( x ) ∈ A ⇒ f ( x ) ∈ B ( ∵ A ⊂ B ) ⇒ x ∈ f − 1 ( B ) ∴ f − 1 ( A ) ⊆ f − 1 ( B ) \begin{aligned} x \in f^{-1} (A) & \Rightarrow f(x) \in A \\ & \Rightarrow f(x) \in B \qquad (\because A \subset B)\\ & \Rightarrow x \in f^{-1}(B) \\ & \therefore f^{-1}(A) \subseteq f^{-1}(B) \end{aligned} x ∈ f − 1 ( A ) ⇒ f ( x ) ∈ A ⇒ f ( x ) ∈ B ( ∵ A ⊂ B ) ⇒ x ∈ f − 1 ( B ) ∴ f − 1 ( A ) ⊆ f − 1 ( B )
再证明 f − 1 ( A ) ≠ f − 1 ( B ) f^{-1}(A) \neq f^{-1}(B) f − 1 ( A ) = f − 1 ( B ) 。
A ⊂ B ⊂ Y ⇒ ∃ y ∈ B , y ∉ A ⇒ ∃ x ∈ X , y = f ( x ) , f ( x ) ∈ f ( B ) , f ( x ) ∉ f ( A ) ⇒ x ∈ f − 1 ( B ) , x ∉ f − 1 ( A ) ∴ f − 1 ( A ) ≠ f − 1 ( B ) \begin{aligned} A \subset B \subset Y & \Rightarrow \exist y \in B , y \notin A \\ & \Rightarrow \exist x \in X, y=f(x), f(x) \in f(B), f(x) \notin f(A) \\ & \Rightarrow x \in f^{-1}(B), x \notin f^{-1}(A) \\ & \therefore f^{-1}(A) \neq f^{-1}(B) \end{aligned} A ⊂ B ⊂ Y ⇒ ∃ y ∈ B , y ∈ / A ⇒ ∃ x ∈ X , y = f ( x ) , f ( x ) ∈ f ( B ) , f ( x ) ∈ / f ( A ) ⇒ x ∈ f − 1 ( B ) , x ∈ / f − 1 ( A ) ∴ f − 1 ( A ) = f − 1 ( B )
故,f − 1 ( A ) ⊂ f − 1 ( B ) f^{-1}(A) \subset f^{-1}(B) f − 1 ( A ) ⊂ f − 1 ( B ) 得证 □ \qquad \Box □
现在证明第5部分:
x ∈ f − 1 ( B ′ ) ⇒ f ( x ) ∈ B ′ ⇒ f ( x ) ∉ B ⇒ x ∉ f − 1 ( B ) ⇒ x ∈ ( f − 1 ( B ) ) ′ ∴ f − 1 ( B ′ ) ⊆ ( f − 1 ( B ) ) ′ \begin{aligned} x \in f^{-1} (B') & \Rightarrow f(x) \in B' \\ & \Rightarrow f(x) \notin B \\ & \Rightarrow x \notin f^{-1}(B) \\ & \Rightarrow x \in (f^{-1}(B))' \\ & \therefore f^{-1} (B') \subseteq (f^{-1}(B))' \end{aligned} x ∈ f − 1 ( B ′ ) ⇒ f ( x ) ∈ B ′ ⇒ f ( x ) ∈ / B ⇒ x ∈ / f − 1 ( B ) ⇒ x ∈ ( f − 1 ( B ) ) ′ ∴ f − 1 ( B ′ ) ⊆ ( f − 1 ( B ) ) ′
⭕
⭕ 下面的证明貌似正确
∀ x , x ∈ ( f − 1 ( B ) ) ′ ⇒ x ∉ f − 1 ( B ) ⇒ f ( x ) ∉ B ⇒ f ( x ) ∈ B ′ ⇒ x ∈ f − 1 ( B ′ ) ∴ ( f − 1 ( B ) ) ′ ⊆ f − 1 ( B ′ ) \begin{aligned} \forall x, x \in (f^{-1}(B))' & \Rightarrow x \notin f^{-1}(B)\\ & \Rightarrow f(x) \notin B \\ & \Rightarrow f(x) \in B' \\ & \Rightarrow x \in f^{-1}(B') \\ & \therefore (f^{-1}(B))' \subseteq f^{-1} (B') \end{aligned} ∀ x , x ∈ ( f − 1 ( B ) ) ′ ⇒ x ∈ / f − 1 ( B ) ⇒ f ( x ) ∈ / B ⇒ f ( x ) ∈ B ′ ⇒ x ∈ f − 1 ( B ′ ) ∴ ( f − 1 ( B ) ) ′ ⊆ f − 1 ( B ′ )
问题在于第二步, x ∉ f − 1 ( B ) ⇏ f ( x ) ∉ B x \notin f^{-1}(B) \nRightarrow f(x) \notin B x ∈ / f − 1 ( B ) ⇏ f ( x ) ∈ / B ,例如f : A → B , f ( x ) = x 2 , A = { x : 0 ≤ x ≤ 1 } , B = { y : 0 ≤ y ≤ 1 } f:A \to B,f(x)=x^2,A=\{x:0 \leq x \leq 1 \}, B=\{y:0 \leq y \leq 1 \} f : A → B , f ( x ) = x 2 , A = { x : 0 ≤ x ≤ 1 } , B = { y : 0 ≤ y ≤ 1 } ,若x = − 1 x = -1 x = − 1 ,显然x ∉ A x \notin A x ∈ / A ,但是f ( x ) = 1 ∈ B f(x)=1 \in B f ( x ) = 1 ∈ B
⭕ 注意: x ∉ X ⇏ f ( x ) ∉ f ( X ) x \notin X \nRightarrow f(x) \notin f(X) x ∈ / X ⇏ f ( x ) ∈ / f ( X ) 。例如 f : R → R , f ( x ) = 0 , X = { x : 0 ≤ x ≤ 1 } , f ( X ) = { 0 } , 有 2 ∉ X , 但 f ( 2 ) = 0 ∈ f ( X ) f:\mathbb{R} \to \mathbb{R} ,f(x)=0, X=\{x:0 \leq x \leq 1\},f(X)=\{0\},\text{ 有 }2 \notin X, \text{ 但 } f(2)=0 \in f(X) f : R → R , f ( x ) = 0 , X = { x : 0 ≤ x ≤ 1 } , f ( X ) = { 0 } , 有 2 ∈ / X , 但 f ( 2 ) = 0 ∈ f ( X )
现在证明第6部分:
x ∈ f − 1 ( ⋃ λ ∈ Λ B λ ) ⇒ f ( x ) ∈ ⋃ λ ∈ Λ B λ ⇒ ∃ λ ∈ Λ , f ( x ) ∈ B λ ⇒ x ∈ ⋃ λ ∈ Λ f − 1 ( B λ ) ∴ f − 1 ( ⋃ λ ∈ Λ B λ ) ⊆ ⋃ λ ∈ Λ f − 1 ( B λ ) \begin{aligned} x \in f^{-1} (\bigcup_{\lambda \in \Lambda} B_\lambda) & \Rightarrow f(x) \in \bigcup_{\lambda \in \Lambda} B_\lambda \\ & \Rightarrow \exist \lambda \in \Lambda, f(x) \in B_\lambda \\ & \Rightarrow x \in \bigcup_{\lambda \in \Lambda} f^{-1}(B_\lambda) \\ & \therefore f^{-1} (\bigcup_{\lambda \in \Lambda} B_\lambda) \subseteq \bigcup_{\lambda \in \Lambda} f^{-1}(B_\lambda) \end{aligned} x ∈ f − 1 ( λ ∈ Λ ⋃ B λ ) ⇒ f ( x ) ∈ λ ∈ Λ ⋃ B λ ⇒ ∃ λ ∈ Λ , f ( x ) ∈ B λ ⇒ x ∈ λ ∈ Λ ⋃ f − 1 ( B λ ) ∴ f − 1 ( λ ∈ Λ ⋃ B λ ) ⊆ λ ∈ Λ ⋃ f − 1 ( B λ )
又:
x ∈ ⋃ λ ∈ Λ f − 1 ( B λ ) ⇒ ∃ λ ∈ Λ , x ∈ f − 1 B λ ⇒ f ( x ) ∈ B λ ⇒ f ( x ) ∈ ⋃ λ ∈ Λ B λ ⇒ x ∈ f − 1 ⋃ λ ∈ Λ B λ ∴ ⋃ λ ∈ Λ f − 1 ( B λ ) ⊆ f − 1 ( ⋃ λ ∈ Λ B λ ) \begin{aligned} x \in \bigcup_{\lambda \in \Lambda} f^{-1}(B_\lambda) & \Rightarrow \exist \lambda \in \Lambda, x \in f^{-1}B_\lambda \\ & \Rightarrow f(x) \in B_\lambda \\ & \Rightarrow f(x) \in \bigcup_{\lambda \in \Lambda}B_\lambda \\ & \Rightarrow x \in f^{-1}\bigcup_{\lambda \in \Lambda}B_\lambda \\ & \therefore \bigcup_{\lambda \in \Lambda} f^{-1}(B_\lambda) \subseteq f^{-1} (\bigcup_{\lambda \in \Lambda} B_\lambda) \end{aligned} x ∈ λ ∈ Λ ⋃ f − 1 ( B λ ) ⇒ ∃ λ ∈ Λ , x ∈ f − 1 B λ ⇒ f ( x ) ∈ B λ ⇒ f ( x ) ∈ λ ∈ Λ ⋃ B λ ⇒ x ∈ f − 1 λ ∈ Λ ⋃ B λ ∴ λ ∈ Λ ⋃ f − 1 ( B λ ) ⊆ f − 1 ( λ ∈ Λ ⋃ B λ )
故,⋃ λ ∈ Λ f − 1 ( B λ ) = f − 1 ( ⋃ λ ∈ Λ B λ ) \bigcup_{\lambda \in \Lambda} f^{-1}(B_\lambda) = f^{-1} (\bigcup_{\lambda \in \Lambda} B_\lambda) ⋃ λ ∈ Λ f − 1 ( B λ ) = f − 1 ( ⋃ λ ∈ Λ B λ ) 得证 □ \qquad \Box □
证明定理 1.5。 Harry:
先证明第1部分。
∀ x , x ∈ A ⇒ f ( x ) ∈ f ( A ) ⇒ x ∈ f − 1 ∘ f ( A ) ∴ A ⊆ f − 1 ∘ f ( A ) \begin{aligned} \forall x, x \in A & \Rightarrow f(x) \in f(A) \\ & \Rightarrow x \in f^{-1} \circ f(A) \\ & \therefore A \subseteq f^{-1} \circ f(A) \end{aligned} ∀ x , x ∈ A ⇒ f ( x ) ∈ f ( A ) ⇒ x ∈ f − 1 ∘ f ( A ) ∴ A ⊆ f − 1 ∘ f ( A )
⭕
再证明第2部分。
∀ y , y ∈ f ∘ f − 1 ( B ) ⇒ f − 1 ( y ) ∈ f − 1 ( B ) ⇒ y ∈ B ∴ f ∘ f − 1 ( B ) ⊆ B \begin{aligned} \forall y, y \in f \circ f^{-1}(B) & \Rightarrow f^{-1}(y) \in f^{-1}(B) \\ & \Rightarrow y \in B \\ & \therefore f \circ f^{-1}(B) \subseteq B \end{aligned} ∀ y , y ∈ f ∘ f − 1 ( B ) ⇒ f − 1 ( y ) ∈ f − 1 ( B ) ⇒ y ∈ B ∴ f ∘ f − 1 ( B ) ⊆ B
⭕
Harry: 从目前看,本书中的⊂ \subset ⊂ 就是⊆ \subseteq ⊆ 。
1.1.3 有限集、可数集和不可数集 两个集合被称为等价,如果存在一个双射 f : X → Y f: X \to Y f : X → Y 。因此,两个集合 X X X 和 Y Y Y 等价的概念意味着它们除了元素的名称之外是相同的。也就是说,我们可以将 Y Y Y 视为通过使用元素 x x x 在 X X X 中的名称更名为 Y Y Y 中某个唯一元素 y y y 而得到的。如果这两个集合是有限的,那么它们等价当且仅当它们包含相同数量的元素 。实际上,有限集合 X X X 的概念等同于说 X X X 等价于 N N N 的某个整数 n ∈ N n \in \mathbb{N} n ∈ N 的子集 N n ⊂ N \mathbb{N}_n \subset \mathbb{N} N n ⊂ N 。为了使这一概念及相关概念更加明确,我们列举以下涉及集合 X X X 和集合 N N N 的定义。
定义 1.6 一个集合 X X X 被称为:
有限的(finite) ,当且仅当 X = ∅ X = \varnothing X = ∅ 或∃ n ∈ N \exist n \in \mathbb{N} ∃ n ∈ N 使得 X X X 等价于 N n \mathbb{N}_n N n ;无限的(infinite) ,如果它不是有限的;可列的(denumerable) ,当且仅当它等价于 N \mathbb{N} N ;可数的(countable) ,当且仅当它是有限的或可列的;不可数的(uncountable) ,如果它不是可列的。一些可数集的性质在下面的例子中给出。
例子 1.3
X ⊂ N ⇒ X X \subset \mathbb{N} \Rightarrow X X ⊂ N ⇒ X 是可数的。X X X 是可数的 ⇔ \Leftrightarrow ⇔ ∃ Y ⊂ N \exist Y \subset \mathbb{N} ∃ Y ⊂ N ,使得 X X X 与 Y Y Y 是等价的。如果 X X X 与 Y Y Y 是等价的,且 Y Y Y 是可数的,那么 X X X 也是可数的。 如果 X ⊂ Y X \subset Y X ⊂ Y 且 Y Y Y 是可数的,那么 X X X 是可数的。 如果 f : X → Y f: X \to Y f : X → Y 是满射,且 X X X 是可数的,那么 Y Y Y 是可数的。 如果 f : X → Y f: X \to Y f : X → Y 是单射,且 Y Y Y 是可数的,那么 X X X 是可数的。 如果 Λ \Lambda Λ 是可数的,且 { X λ : λ ∈ Λ } \{X_\lambda: \lambda \in \Lambda\} { X λ : λ ∈ Λ } 是一组可数集合,那么 ⋃ λ ∈ Λ X λ \bigcup_{\lambda \in \Lambda} X_\lambda ⋃ λ ∈ Λ X λ 是可数的。换句话说,可数个可数集的并集是可数的。 假定例 1.3 是事实,我们可以很容易地证明集合 Z 2 \mathbb{Z}^2 Z 2 和有理数集 Q \mathbb{Q} Q 都是可数集。首先注意到函数 f : N → Z f: \mathbb{N} \to \mathbb{Z} f : N → Z ,定义为 f ( 2 n ) = n f(2n) = n f ( 2 n ) = n 和 f ( 2 n − 1 ) = − n + 1 f(2n-1) = -n+1 f ( 2 n − 1 ) = − n + 1 ,是一个双射。因此Z \mathbb{Z} Z 等价于 N \mathbb{N} N ,因而是可数的。对于每个 i ∈ Z i \in \mathbb{Z} i ∈ Z ,集合 X i = { f ( i , n ) : n ∈ Z } X_i = \{f(i,n) : n \in \mathbb{Z}\} X i = { f ( i , n ) : n ∈ Z } 是可数的。然后,由于 Z \mathbb{Z} Z 是可数的,且 { X i : i ∈ Z } \{X_i : i \in \mathbb{Z}\} { X i : i ∈ Z } 是一组可数集合,根据例 1.3(7),我们得知 Z 2 = ⋃ i ∈ Z X i \mathbb{Z}^2 = \bigcup_{i \in \mathbb{Z}} X_i Z 2 = ⋃ i ∈ Z X i 也是可数的。
要证明 Q \mathbb{Q} Q 是可数的,我们定义一个映射 f : Z 2 → Q f: \mathbb{Z}^2 \to \mathbb{Q} f : Z 2 → Q 如下:
f ( i , j ) = { i j 如果 j ≠ 0 0 如果 j = 0 \begin{equation} f(i, j) = \begin{cases} \frac{i}{j} & \text{如果} j \neq 0 \\ 0 & \text{如果} j = 0 \end{cases} \tag{1.2} \end{equation} f ( i , j ) = { j i 0 如果 j = 0 如果 j = 0 ( 1.2 )
f f f 显然是满射。现在根据例子1.3(5),我们得到 Q \mathbb{Q} Q 是可数的。
我们给每个集合 X X X 都附上一个标签 c a r d ( X ) card(X) c a r d ( X ) ,称为 X X X 的势(cardinality ),它提供了 X X X 大小的度量。特别是,这个标签应以某种方式区分两个给定集合中哪一个有更多的成员。
Harry:
势是一种相对的概念,它表示两个集合之间是否可以建立一一对应的关系。如果两个集合可以建立一一对应,那么它们就是等势的,记为A ∼ B A \sim B A ∼ B 。如果一个集合的势不小于另一个集合的势,那么就存在一个单射(一对一的映射)从一个集合到另一个集合,记为A ⪯ B A \preceq B A ⪯ B 。如果一个集合的势严格大于另一个集合的势,那么就不存在一个双射(一一对应的映射)从一个集合到另一个集合,记为A ≺ B A \prec B A ≺ B 。势的英文是cardinality或power。
基数是一种绝对的概念,它表示一个集合的势所对应的一个具体的数或符号。基数可以用来比较不同集合的大小,而不需要考虑它们之间是否可以建立一一对应。基数通常用符号ℵ \aleph ℵ 或ℶ \beth ℶ 来表示,后面跟着一个下标,表示不同的无限基数。例如,ℵ 0 \aleph_0 ℵ 0 表示可数无限集的基数,ℵ 1 \aleph_1 ℵ 1 表示第一个不可数无限集的基数,ℶ 0 \beth_0 ℶ 0 表示自然数集的基数,ℶ 1 \beth_1 ℶ 1 表示实数集的基数。基数的英文是cardinal number。
我们说两个集合 X X X 和 Y Y Y 具有相同的势,当且仅当它们是等价的。对于有限集而言,通过当X X X 等价于 N n \mathbb{N}_n N n 时分配 c a r d ( X ) = n card(X) = n c a r d ( X ) = n ,并且约定当且仅当 X = ∅ X = \varnothing X = ∅ 时 c a r d ( X ) = 0 card(X) = 0 c a r d ( X ) = 0 ,满足了这一要求。因此,如果 X X X 和 Y Y Y 是有限集,那么当且仅当 X X X 的元素比 Y Y Y 少时,c a r d ( X ) < c a r d ( Y ) card(X) < card(Y) c a r d ( X ) < c a r d ( Y ) 。特别地,如果 X X X 是 Y Y Y 的真子集,那么 c a r d ( X ) < c a r d ( Y ) card(X) < card(Y) c a r d ( X ) < c a r d ( Y ) 。然而,对于无限可数集,这不再成立,因为我们有严格的子集序列 N ⊂ Z ⊂ Q \mathbb{N} \subset \mathbb{Z} \subset \mathbb{Q} N ⊂ Z ⊂ Q ,而 c a r d ( N ) = c a r d ( Z ) = c a r d ( Q ) card(\mathbb{N}) = card(\mathbb{Z}) = card(\mathbb{Q}) c a r d ( N ) = c a r d ( Z ) = c a r d ( Q ) 。尽管这三个集合包含不同的元素,它们在某种意义上的大小都是相同的,因为对于 Q \mathbb{Q} Q 的每个元素都存在唯一的整数 n ∈ N n \in \mathbb{N} n ∈ N ,这意味着每个有理数都可以用唯一的整数标记。这表明整数和有理数一样多。因此,它们在大小上都是相同的。
Harry :
⭕ 如何构建Q → Z \mathbb{Q} \to \mathbb{Z} Q → Z 的双射? 我们可以考虑以下一个可能的构建方式:
假设我们有一个有理数 r = a b r = \frac{a}{b} r = b a ,其中 a a a 和 b b b 是整数,且 b b b 不等于零,那么我们可以将有理数 r r r 映射到整数:
f ( r ) = 2 a × 3 b f(r) = 2^a \times 3^b f ( r ) = 2 a × 3 b
这个映射是一个从有理数到整数的双射。为了证明它是一个双射,我们需要证明两个方向:
单射(Injective) :如果 f ( r 1 ) = f ( r 2 ) f(r_1) = f(r_2) f ( r 1 ) = f ( r 2 ) ,则 r 1 = r 2 r_1 = r_2 r 1 = r 2 。这是因为如果两个有理数 r 1 r_1 r 1 和 r 2 r_2 r 2 对应的 a a a 和 b b b 相等,那么它们的唯一表示 2 a × 3 b 2^a \times 3^b 2 a × 3 b 也必然相等。
满射(Surjective) :对于任意整数 n n n ,存在有理数 r r r 使得 f ( r ) = n f(r) = n f ( r ) = n 。这是因为任何整数都可以分解为 2 a × 3 b 2^a \times 3^b 2 a × 3 b 的形式,其中 a a a 和 b b b 可以是负数。 这个映射实际上是 Cantor 提出的一种将有理数映射到自然数(整数的一部分)的方式,展示了有理数和整数之间存在一一对应的关系。这种对应的存在说明了有理数的基数是可数无穷的。
⭕ 负数的情况呢?
C 1 C_1 C 1 . c a r d ( X ) ≤ c a r d ( Y ) ⇔ ℵ ( X ) ≤ ℵ ( Y ) \qquad card(X) \leq card(Y) \Leftrightarrow \aleph(X) \leq \aleph(Y) c a r d ( X ) ≤ c a r d ( Y ) ⇔ ℵ ( X ) ≤ ℵ ( Y ) 。
C 2 C_2 C 2 . c a r d ( X ) = c a r d ( Y ) ⇔ ℵ ( X ) = ℵ ( Y ) \qquad card(X) = card(Y) \Leftrightarrow \aleph(X) = \aleph(Y) c a r d ( X ) = c a r d ( Y ) ⇔ ℵ ( X ) = ℵ ( Y ) 。
Georg Cantor证明了不存在从自然数 N N N 到实数 R R R 的双射 f : N → R f : \mathbb{N} \to \mathbb{R} f : N → R [37, 38]。由于 N ⊂ R \mathbb{N} \subset \mathbb{R} N ⊂ R 是一个严格的子集,结合Cantor的结果,我们必须有 c a r d ( N ) < c a r d ( R ) card(\mathbb{N}) < card(\mathbb{R}) c a r d ( N ) < c a r d ( R ) 。 N \mathbb{N} N 的基数通常用符号 ℵ ( N ) = ℵ 0 \alef(N) = {\alef}_0 ℵ ( N ) = ℵ 0 表示,而 R \mathbb{R} R 的基用 ℵ ( R ) = ζ {\alef}(R) = \zeta ℵ ( R ) = ζ 表示,其中 ζ \zeta ζ 被称为连续体(continuum )的基数。我们注意到,任何满足 ℵ ( X ) ≤ ℵ 0 \alef(X) \leq {\alef}_0 ℵ ( X ) ≤ ℵ 0 的集合 X X X 都是可数的,而任何满足 ℵ ( X ) > ℵ 0 \alef(X) > {\alef}_0 ℵ ( X ) > ℵ 0 的集合 X X X 都是不可数的。
读者需要记住,基数是集合,即使在有限的情况下也是如此,但它与基于性质 C 1 C_1 C 1 和 C 2 C_2 C 2 的 card 的概念密切相关。因此,我们可以将唯一的整数与有限集关联起来,但需要用超限数来标记无限集。例如,定义符号 0 ‾ = ∅ \overline{0} = \varnothing 0 = ∅ ,1 ‾ = { ∅ } \overline{1} = \{\varnothing\} 1 = { ∅ } ,2 ‾ = { ∅ , { ∅ } } \overline{2} = \{\varnothing, \{\varnothing\}\} 2 = { ∅ , { ∅ }} ,3 ‾ = { ∅ , { ∅ } , { ∅ , { ∅ } } } \overline{3} = \{\varnothing, \{\varnothing\}, \{\varnothing, \{\varnothing\}\}\} 3 = { ∅ , { ∅ } , { ∅ , { ∅ }}} ,依此类推,那么 ℵ ( N n ) = n ‾ \alef(\mathbb{N}_n) = \overline{n} ℵ ( N n ) = n 是一个集合,而 c a r d ( N n ) = n card(\mathbb{N}_n) = n c a r d ( N n ) = n 。由此还可得到 ℵ ( ℵ ( N n ) ) = ℵ ( n ‾ ) = n ‾ \alef(\alef(\mathbb{N}_n)) = \alef(\overline{n}) = \overline{n} ℵ ( ℵ ( N n )) = ℵ ( n ) = n 。
Harry:
“基数就是集合”这个说法,可以从 Cantor 的观点出发,他认为集合的大小主要由其中元素的数量来刻画,而基数就是用来度量这个数量的。因此,每个集合都有一个唯一对应的基数。
需要注意的是,基数本身也是一个集合。在 Cantor 的集合论中,基数通常被定义为等势集合中的一个代表。例如,0 ‾ \overline{0} 0 代表空集,1 ‾ \overline{1} 1 代表包含一个元素的集合,2 ‾ \overline{2} 2 代表包含两个元素的集合,以此类推。这种方式使得我们可以通过集合的基数来描述集合的大小。
Cantor的工作的另一个结果是对于任何集合 X X X ,都有 c a r d ( X ) < c a r d ( 2 X ) card(X) < card(2^X) c a r d ( X ) < c a r d ( 2 X ) 。如果 ℵ ( X ) = ℵ 0 \alef(X) = {\alef}_0 ℵ ( X ) = ℵ 0 ,则 2 X 2^X 2 X 的基数用 ℵ ( 2 X ) = ℵ 1 \alef(2^X) = {\alef}_1 ℵ ( 2 X ) = ℵ 1 表示。因此,ℵ 0 < ℵ 1 {\alef}_0 < {\alef}_1 ℵ 0 < ℵ 1 且 ℵ 0 < ζ {\alef}_0 < \zeta ℵ 0 < ζ 。关于 ℵ 1 = ζ {\alef}_1 = \zeta ℵ 1 = ζ 是否成立的问题被称为连续体假设。Kurt Godel证明了基于Zermelo-Fraenckel公理,无论是否包括选择公理,都不可能反驳连续体假设,而Paul J. Cohen证明了基于Zermelo-Fraenckel公理,无论是否包括选择公理,都不可能证明连续体假设 [97, 56]。对于我们的目的,我们将任何满足 ℵ ( X ) ≥ ℵ 0 {\alef}_(X) \geq {\alef}_0 ℵ ( X ) ≥ ℵ 0 的集合 X X X 简单地标识为无穷大符号 ∞ \infty ∞ 。这简化了测量集合大小的问题。
定义 1.7 如果 U U U 表示论域的全集,那么计数函数(counting function ) ∣ ⋅ ∣ : 2 U → N [ 0 , 1 ] | \cdot | : 2^U \to \mathbb{N}[0, 1] ∣ ⋅ ∣ : 2 U → N [ 0 , 1 ] 被定义为:
∣ A ∣ = { c a r d ( A ) 如果 A 是有限的 ∞ 如果 ℵ ( A ) ≥ ℵ 0 |A| = \begin{cases} \text{$card$}(A) & \text{如果 } A \text{ 是有限的} \\ \infty & \text{如果 } \alef(A) \geq \aleph_0 \end{cases} ∣ A ∣ = { c a r d ( A ) ∞ 如果 A 是有限的 如果 ℵ ( A ) ≥ ℵ 0
因此,对于任意 A ∈ 2 U A \in 2^U A ∈ 2 U ,都有 0 ≤ ∣ A ∣ ≤ 1 0 \leq |A| \leq 1 0 ≤ ∣ A ∣ ≤ 1 ,且 ∣ A ∣ = 0 |A| = 0 ∣ A ∣ = 0 当且仅当 A = ∅ A = \varnothing A = ∅ 。对于所有无限集,它们都映射到相同的符号 1,代表无穷大。
如果一个集合 X 是可列(denumerable)的,那么存在一个双射 f : N → X f : \mathbb{N} \to X f : N → X 。这样的双射为计数 X X X 中元素提供了一个方便的工具,这是通过将 X X X 的每个元素与由 f f f 确定的唯一数值标签相对应来进行标识的。具体而言,对于 x ∈ X x \in X x ∈ X ,我们设 x = x i x = x_i x = x i ,其中 f ( i ) = x f(i) = x f ( i ) = x 。由于 f f f 是一对一的,有x i = x j ⇔ i = j x_i = x_j \Leftrightarrow i = j x i = x j ⇔ i = j 。由于 f f f 也是满射,集合 X X X 现在可以表示为序列 X = { x 1 , x 2 , x 3 , … } X = \{x_1, x_2, x_3, \ldots\} X = { x 1 , x 2 , x 3 , … } 。
例 1.4 设 g : N 2 → N g : \mathbb{N}^2 \to \mathbb{N} g : N 2 → N 定义为
g ( i , j ) = 1 2 ( ( i + j − 1 ) ( i + j − 2 ) + j ) ∀ ( i , j ) ∈ N 2 g(i, j) = \frac{1}{2} \left( (i+j-1)(i+j-2) + j \right) \quad \forall (i, j) \in \mathbb{N}^2 g ( i , j ) = 2 1 ( ( i + j − 1 ) ( i + j − 2 ) + j ) ∀ ( i , j ) ∈ N 2
根据 g g g 的定义,我们有 g ( 1 , 1 ) = 1 , g ( 2 , 1 ) = 2 , g ( 1 , 2 ) = 3 , g ( 3 , 1 ) = 4 g(1,1) = 1, g(2,1) = 2, g(1,2) = 3, g(3,1) = 4 g ( 1 , 1 ) = 1 , g ( 2 , 1 ) = 2 , g ( 1 , 2 ) = 3 , g ( 3 , 1 ) = 4 等。当 j = 1 j = 1 j = 1 或 i = 1 i = 1 i = 1 时,函数分别取得简单的形式 g ( i , 1 ) = 2 i ( i − 1 ) + 1 g(i,1) = 2i(i-1) + 1 g ( i , 1 ) = 2 i ( i − 1 ) + 1 和 g ( 1 , j ) = 2 j ( j − 1 ) + j g(1,j) = 2j(j-1) + j g ( 1 , j ) = 2 j ( j − 1 ) + j 。这些观察也使得很容易证明 g g g 是一一对应(即单射)的,并且是满射的。因此,g g g 有一个逆 g − 1 : N → N 2 g^{-1} : \mathbb{N} \to \mathbb{N}^2 g − 1 : N → N 2 。这意味着我们有两种等效的方式来标记 N 2 \mathbb{N}^2 N 2 中的点 x = ( i , j ) \mathbf{x} = (i, j) x = ( i , j ) 。具体而言,我们定义 x l = x ∈ N 2 ⇔ g − 1 ( l ) = x \mathbf{x}_\mathcal{l} = \mathbf{x} \in \mathbb{N}^2 \Leftrightarrow g^{-1}(\mathcal{l}) = \mathbf{x} x l = x ∈ N 2 ⇔ g − 1 ( l ) = x ,或等价地,x l = x ⇔ g ( x ) = l \mathbf{x}_\mathcal{l} = \mathbf{x} \Leftrightarrow g(\mathbf{x}) = \mathcal{l} x l = x ⇔ g ( x ) = l 。图 1.1 说明了 N 2 \mathbb{N}^2 N 2 元素的这种特定标记方式。
图 1.1 N 2 \mathbb{N}^2 N 2 元素的序列标记。N 2 \mathbb{N}^2 N 2 中元素的排序如箭头所示,沿着负斜率为 -1 的对角线经过N 2 \mathbb{N}^2 N 2 中的点。这里k = g ( i , 1 ) k = g(i, 1) k = g ( i , 1 ) ,k + ( i − 1 ) = g ( 1 , j ) k + (i-1) = g(1, j) k + ( i − 1 ) = g ( 1 , j ) ,其中i = j i = j i = j ,且l = g ( i , j ) \mathcal{l} = g(i, j) l = g ( i , j ) 。
练习 1.1.3
形如 x 2 + b x + c = 0 x^2 + bx + c = 0 x 2 + b x + c = 0 的方程的解,其中 b , c ∈ Z b,c \in \mathbb{Z} b , c ∈ Z ,被称为二次整数。证明二次整数的集合是可数的。 您好,这是Bing。我可以帮您证明二次整数的集合是可数的。😊 Harry:
为了证明二次整数的集合是可数的,我们需要构造一个从自然数集N \mathbb{N} N 到二次整数的集合的双射,也就是说,我们需要找到一个一一对应的函数,使得每个自然数都对应一个唯一的二次整数,反之亦然。这样,我们就可以用自然数来编号二次整数,从而说明二次整数的集合和自然数集有相同的势,也就是可数无限。
为了构造这样的双射,我们可以利用二次整数的定义,即形如 x 2 + b x + c = 0 x^2 + bx + c = 0 x 2 + b x + c = 0 的方程的解,其中 b , c ∈ Z b,c \in \mathbb{Z} b , c ∈ Z 。我们可以将二次整数看作是由三个整数( x , b , c ) (x,b,c) ( x , b , c ) 组成的有序三元组,其中x x x 是方程的一个解,b b b 和c c c 是方程的系数。例如,( 2 , 3 , − 4 ) (2,3,-4) ( 2 , 3 , − 4 ) 是一个二次整数,因为它对应了方程x 2 + 3 x − 4 = 0 x^2 + 3x - 4 = 0 x 2 + 3 x − 4 = 0 的一个解x = 2 x = 2 x = 2 。
我们可以将二次整数的集合表示为{ ( x , b , c ) ∣ x 2 + b x + c = 0 , x , b , c ∈ Z } \{(x,b,c) \mid x^2 + bx + c = 0, x,b,c \in \mathbb{Z}\} {( x , b , c ) ∣ x 2 + b x + c = 0 , x , b , c ∈ Z } ,这是一个由整数构成的三维空间中的一个曲面。我们可以将这个曲面划分为无限多个水平的层,每个层对应一个固定的x x x 值,例如x = 0 , x = 1 , x = − 1 , x = 2 , x = − 2 x = 0, x = 1, x = -1, x = 2, x = -2 x = 0 , x = 1 , x = − 1 , x = 2 , x = − 2 等。每个层上的点都是形如( x , b , c ) (x,b,c) ( x , b , c ) 的二次整数,其中b b b 和c c c 可以取任意的整数值,只要满足x 2 + b x + c = 0 x^2 + bx + c = 0 x 2 + b x + c = 0 。
我们可以用以下的方法来编号每个层上的点:
首先,我们从原点( x , 0 , 0 ) (x,0,0) ( x , 0 , 0 ) 开始,这是每个层上的唯一的点,我们将它编号为0 0 0 。 然后,我们沿着b b b 轴的正方向移动一个单位,得到点( x , 1 , − x 2 ) (x,1,-x^2) ( x , 1 , − x 2 ) ,我们将它编号为1 1 1 。 接着,我们沿着b b b 轴的负方向移动两个单位,得到点( x , − 1 , − x 2 ) (x,-1,-x^2) ( x , − 1 , − x 2 ) ,我们将它编号为− 1 -1 − 1 。 依此类推,我们沿着b b b 轴的正负方向交替移动,每次增加一个单位,得到点( x , b , − x 2 − b x ) (x,b,-x^2 - bx) ( x , b , − x 2 − b x ) ,我们将它编号为b b b 。 我们可以用以下的公式来表示这个编号的规律:
( x , b , − x 2 − b x ) ↦ b (x,b,-x^2 - bx) \mapsto b ( x , b , − x 2 − b x ) ↦ b
这样,我们就可以用一个整数b b b 来表示每个层上的一个点( x , b , − x 2 − b x ) (x,b,-x^2 - bx) ( x , b , − x 2 − b x ) ,并且这个对应是一一的,也就是说,不同的b b b 值对应不同的点,反之亦然。
我们可以用类似的方法来编号每个层之间的点:
首先,我们从x = 0 x = 0 x = 0 的层开始,这是最低的层,我们将它编号为0 0 0 。 然后,我们沿着x x x 轴的正方向移动一个单位,得到x = 1 x = 1 x = 1 的层,我们将它编号为1 1 1 。 接着,我们沿着x x x 轴的负方向移动两个单位,得到x = − 1 x = -1 x = − 1 的层,我们将它编号为− 1 -1 − 1 。 依此类推,我们沿着x x x 轴的正负方向交替移动,每次增加一个单位,得到x = n x = n x = n 的层,我们将它编号为n n n 。 我们可以用以下的公式来表示这个编号的规律:
( x , b , c ) ↦ ( n , b ) (x,b,c) \mapsto (n,b) ( x , b , c ) ↦ ( n , b )
其中n n n 是x x x 的编号,b b b 是( x , b , c ) (x,b,c) ( x , b , c ) 在x = n x = n x = n 的层上的编号。这样,我们就可以用一个有序整数对( n , b ) (n,b) ( n , b ) 来表示一个二次整数( x , b , c ) (x,b,c) ( x , b , c ) ,并且这个对应是一一的,也就是说,不同的( n , b ) (n,b) ( n , b ) 对应不同的二次整数,反之亦然。
最后,我们可以用以下的方法来将一个有序整数对( n , b ) (n,b) ( n , b ) 转换为一个自然数,从而完成从二次整数到自然数的双射:
首先,我们将n n n 和b b b 分别转换为二进制数,例如,n = 5 n = 5 n = 5 转换为101 101 101 ,b = − 3 b = -3 b = − 3 转换为− 11 -11 − 11 。 然后,我们将n n n 和b b b 的二进制数交错排列,得到一个新的二进制数,例如,( 101 , − 11 ) (101,-11) ( 101 , − 11 ) 交错排列为1 − 011 − 1 1-011-1 1 − 011 − 1 。 接着,我们在新的二进制数的最前面加上一个符号位,表示正负,例如,1 − 011 − 1 1-011-1 1 − 011 − 1 加上符号位为01 − 011 − 1 01-011-1 01 − 011 − 1 。 最后,我们将新的二进制数转换为十进制数,例如,01 − 011 − 1 01-011-1 01 − 011 − 1 转换为23 23 23 。 我们可以用以下的公式来表示这个转换的规律:
( n , b ) ↦ sign ( n , b ) ⋅ 2 ∣ n ∣ + ∣ b ∣ + ∑ i = 0 ∣ n ∣ + ∣ b ∣ − 1 bit ( n , b , i ) > ⋅ 2 i (n,b) \mapsto \text{sign}(n,b) \cdot 2^{|n| + |b|} + \sum_{i = 0}^{|n| + |b| - 1} \text{bit}(n,b,i) >\cdot 2^i ( n , b ) ↦ sign ( n , b ) ⋅ 2 ∣ n ∣ + ∣ b ∣ + i = 0 ∑ ∣ n ∣ + ∣ b ∣ − 1 bit ( n , b , i ) > ⋅ 2 i
其中sign ( n , b ) \text{sign}(n,b) sign ( n , b ) 是( n , b ) (n,b) ( n , b ) 的符号位,如果n n n 和b b b 同号,就为0 0 0 ,如果异号,就为1 1 1 ;∣ n ∣ |n| ∣ n ∣ 和∣ b ∣ |b| ∣ b ∣ 分别是n n n 和b b b 的二进制位数;bit ( n , b , i ) \text{bit}(n,b,i) bit ( n , b , i ) 是( n , b ) (n,b) ( n , b ) 的第i i i 个二进制位,从右往左数,如果是n n n 的位,就取n n n 的绝对值的第i i i 个二进制位,如果是b b b 的位,就取b b b 的绝对值的第i i i 个二进制位。
这样,我们就可以用一个自然数来表示一个有序整数对( n , b ) (n,b) ( n , b ) ,从而表示一个二次整数( x , b , c ) (x,b,c) ( x , b , c ) ,并且这个对应是一一的,也就是说,不同的自然数对应不同的二次整数,反之亦然。
综上所述,我们已经构造了一个从自然数集N \mathbb{N} N 到二次整数的集合的双射,这就证明了二次整数的集合是可数的。□ \qquad \Box □
假设例 1.3 为事实,证明区间 ( 0 , 1 ) = { x ∈ R : 0 < x < 1 } (0,1) = \{x \in \mathbb{R} : 0 < x < 1\} ( 0 , 1 ) = { x ∈ R : 0 < x < 1 } 是不可数的。 Harry
使用反证法:
假设区间 ( 0 , 1 ) (0,1) ( 0 , 1 ) 是可数的,那么它的所有元素可以排成一个无穷序列,记为 x 1 , x 2 , x 3 , … , x n , … x_1, x_2, x_3, \dots, x_n, \dots x 1 , x 2 , x 3 , … , x n , … ,其中每个 x i x_i x i 都是一个介于 0 0 0 和 1 1 1 之间的实数。 把每个 x i x_i x i 表示为一个十进制的无限小数,即 x i = 0. a i 1 a i 2 a i 3 … a i n … x_i = 0.a_{i1}a_{i2}a_{i3}\dots a_{in} \dots x i = 0. a i 1 a i 2 a i 3 … a in … ,其中每个 a i j a_{ij} a ij 都是一个 0 0 0 到 9 9 9 之间的整数。为了避免有限小数的两种表示法,例如 0.5 0.5 0.5 和 0.499 … 0.499\dots 0.499 … ,我们规定不允许小数部分以无限多个 9 9 9 结尾,即如果 x i x_i x i 是有限小数,那么它的最后一位不能是 9 9 9 。 ∵ \because \qquad ∵ 由于我们规定不允许小数部分以无限多个 9 9 9 结尾,那么我们就可以推出如果 x i x_i x i 是有限小数,那么它的最后一位不能是 9 9 9 。这是因为如果 x i x_i x i 的最后一位是 9 9 9 ,那么我们就可以将它变成一个以无限多个 9 9 9 结尾的小数,方法是将最后一位 9 9 9 去掉,并在后面补上无限多个 9 9 9 。例如,0.29 0.29 0.29 可以变成 0.28999 … 0.28999\dots 0.28999 … ,0.009 0.009 0.009 可以变成 0.008999 … 0.008999\dots 0.008999 … ,0.9 0.9 0.9 可以变成 0.8999 … 0.8999\dots 0.8999 … 。这样就违反了我们的规定,所以我们必须排除这种情况,即如果 x i x_i x i 是有限小数,那么它的最后一位不能是 9 9 9 。
构造一个新的实数 y = 0. b 1 b 2 b 3 … b n … y = 0.b_1b_2b_3\dots b_n \dots y = 0. b 1 b 2 b 3 … b n … ,其中每个 b i b_i b i 都是一个 0 0 0 到 9 9 9 之间的整数,且满足 b i ≠ a i i b_i \neq a_{ii} b i = a ii ,即每个 b i b_i b i 都不等于对应的 x i x_i x i 的小数部分的第 i i i 位。为了保证 y y y 不以无限多个 9 9 9 结尾,我们可以进一步规定 b i ≠ 9 b_i \neq 9 b i = 9 。 由于 y y y 是一个介于 0 0 0 和 1 1 1 之间的实数,那么它应该属于区间 ( 0 , 1 ) (0,1) ( 0 , 1 ) ,但是由于 y y y 和序列中的每个 x i x_i x i 都至少有一位小数不同,那么它又不可能属于序列中的任何一个元素。这就产生了矛盾,说明我们的假设是错误的,即区间 ( 0 , 1 ) (0,1) ( 0 , 1 ) 不是可数的。□ \qquad \Box □