부분 문자열 매칭
^ |
문자열의 시작 |
$ |
문자열의 끝 |
* |
문자열의 부분 |
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166 |
import re
import requests
from bs4 import BeautifulSoup
links = soup.select('a[href^="http://v.media.daum.net/v"]')
for link in links:
print(link['href'])
================<<실행결과>>================
http://v.media.daum.net/v/20171003153007719
http://v.media.daum.net/v/20171003153007719
http://v.media.daum.net/v/20171003080207491
http://v.media.daum.net/v/20171002180507050
http://v.media.daum.net/v/20171003060045657
http://v.media.daum.net/v/20171003060045657
http://v.media.daum.net/v/20171002193202816
http://v.media.daum.net/v/20171002120007487
http://v.media.daum.net/v/20171003000942416
http://v.media.daum.net/v/20171003000942416
http://v.media.daum.net/v/20171002135819842
http://v.media.daum.net/v/20171002135819842
http://v.media.daum.net/v/20171002131508244
http://v.media.daum.net/v/20171001211307287
http://v.media.daum.net/v/20171001130246350
http://v.media.daum.net/v/20171002030234643
http://v.media.daum.net/v/20171002030234643
http://v.media.daum.net/v/20171001201335552
http://v.media.daum.net/v/20171001194535267
http://v.media.daum.net/v/20171003113739282
http://v.media.daum.net/v/20171003113739282
http://v.media.daum.net/v/20171002104918155
http://v.media.daum.net/v/20170920030430244
http://v.media.daum.net/v/20170916195253268
http://v.media.daum.net/v/20171003080029438
http://v.media.daum.net/v/20171003080029438
http://v.media.daum.net/v/20171003064309891
http://v.media.daum.net/v/20171002091510629
http://v.media.daum.net/v/20171001081313584
http://v.media.daum.net/v/20171003155102944
http://v.media.daum.net/v/20171003150205408
http://v.media.daum.net/v/20171003150205408
http://v.media.daum.net/v/20171003150103393
http://v.media.daum.net/v/20171003150103393
http://v.media.daum.net/v/20171003120004501
http://v.media.daum.net/v/20171002201326119
http://v.media.daum.net/v/20171003130229975
http://v.media.daum.net/v/20171003090202226
http://v.media.daum.net/v/20171003135455460
http://v.media.daum.net/v/20171003072447222
http://v.media.daum.net/v/20171003080207491
http://v.media.daum.net/v/20171002202437207
http://v.media.daum.net/v/20171003074824349
http://v.media.daum.net/v/20171003003052543
http://v.media.daum.net/v/20171003002852538
http://v.media.daum.net/v/20171003075044367
http://v.media.daum.net/v/20171003070402140
http://v.media.daum.net/v/20171003062707812
http://v.media.daum.net/v/20171003075045368
http://v.media.daum.net/v/20171003160221170
http://v.media.daum.net/v/20171003153007719
http://v.media.daum.net/v/20171003153005718
http://v.media.daum.net/v/20171003150205408
http://v.media.daum.net/v/20171003150103393
http://v.media.daum.net/v/20171003145700320
http://v.media.daum.net/v/20171003143124965
http://v.media.daum.net/v/20171003141602754
http://v.media.daum.net/v/20171003140104557
http://v.media.daum.net/v/20171003170153776
http://v.media.daum.net/v/20171003170153776
http://v.media.daum.net/v/20171003170103766
http://v.media.daum.net/v/20171003170103766
http://v.media.daum.net/v/20171003153605777
http://v.media.daum.net/v/20171003134701365
http://v.media.daum.net/v/20171003144300104
http://v.media.daum.net/v/20171003140217573
http://v.media.daum.net/v/20171003165955753
http://v.media.daum.net/v/20171003162829455
http://v.media.daum.net/v/20171003150020382
http://v.media.daum.net/v/20171003133203236
http://v.media.daum.net/v/20171003144943192
http://v.media.daum.net/v/20171003170153776
http://v.media.daum.net/v/20171003163756548
http://v.media.daum.net/v/20171003085005989
http://v.media.daum.net/v/20171003060027639
http://v.media.daum.net/v/20171003144538134
http://v.media.daum.net/v/20171002220823850
http://v.media.daum.net/v/20171003130230976
http://v.media.daum.net/v/20171003151716578
http://v.media.daum.net/v/20171002211223513
http://v.media.daum.net/v/20171003135545472
http://v.media.daum.net/v/20171003172125124
http://v.media.daum.net/v/20171003133006218
http://v.media.daum.net/v/20171003160102140
http://v.media.daum.net/v/20171003141209699
http://v.media.daum.net/v/20171003170049765
http://v.media.daum.net/v/20171003160308178
http://v.media.daum.net/v/20171003154603881
http://v.media.daum.net/v/20171003150106396
http://v.media.daum.net/v/20171003085101997
http://v.media.daum.net/v/20171003155102944
http://v.media.daum.net/v/20171003084922982
http://v.media.daum.net/v/20171003162937466?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003074913353?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003160035129?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003090407291?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003090005103?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003155315989?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003090019122?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003165244705?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003153647783?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003163140487?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003162729448?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003003924574?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003135157429?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003001048431?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003171553975?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003111531046?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003064200889?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003150922491?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003010111683?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003152425660?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003090633331?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003161805373?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003104404614?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003122624739?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003130103956?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003123537802?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003114416328?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003081002606?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003080303506?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003143023951?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003170238781
http://v.media.daum.net/v/20171003171823024
http://v.media.daum.net/v/20171003171859058
http://v.media.daum.net/v/20171003171449955
http://v.media.daum.net/v/20171003171901062
http://v.media.daum.net/v/20171003171750011
http://v.media.daum.net/v/20171003171800014
http://v.media.daum.net/v/20171003164533620
http://v.media.daum.net/v/20171003171826028
http://v.media.daum.net/v/20171003174923716
http://v.media.daum.net/v/20171003162702444
http://v.media.daum.net/v/20171003170445808
http://v.media.daum.net/v/20171003171511963
http://v.media.daum.net/v/20171003171512964
http://v.media.daum.net/v/20171003171828032
http://v.media.daum.net/v/20171003163206492
http://v.media.daum.net/v/20171003093354662
http://v.media.daum.net/v/20171003113209224
http://v.media.daum.net/v/20171003171829033
http://v.media.daum.net/v/20171003171846046
http://v.media.daum.net/v/20171003083238823
http://v.media.daum.net/v/20171003100347086
http://v.media.daum.net/v/20171003113402241
http://v.media.daum.net/v/20171003170719856
http://v.media.daum.net/v/20171003150139401
http://v.media.daum.net/v/20171003173243386
http://v.media.daum.net/v/20171003165100683
http://v.media.daum.net/v/20171003152849696
http://v.media.daum.net/v/20171003173205372
http://v.media.daum.net/v/20171003105358739
|
cs |
1
2
3
4
5
6
7
8
9
10 |
links = soup.select('a[href$="20171003150106396"]')
for link in links:
print(link['href'])
================<<실행결과>>================
http://v.media.daum.net/v/20171003150106396
|
cs |
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160 |
links = soup.select('a[href*="//v.media"]')
for link in links:
print(link['href'])
================<<실행결과>>================
http://v.media.daum.net/v/20171003153007719
http://v.media.daum.net/v/20171003153007719
http://v.media.daum.net/v/20171003080207491
http://v.media.daum.net/v/20171002180507050
http://v.media.daum.net/v/20171003060045657
http://v.media.daum.net/v/20171003060045657
http://v.media.daum.net/v/20171002193202816
http://v.media.daum.net/v/20171002120007487
http://v.media.daum.net/v/20171003000942416
http://v.media.daum.net/v/20171003000942416
http://v.media.daum.net/v/20171002135819842
http://v.media.daum.net/v/20171002135819842
http://v.media.daum.net/v/20171002131508244
http://v.media.daum.net/v/20171001211307287
http://v.media.daum.net/v/20171001130246350
http://v.media.daum.net/v/20171002030234643
http://v.media.daum.net/v/20171002030234643
http://v.media.daum.net/v/20171001201335552
http://v.media.daum.net/v/20171001194535267
http://v.media.daum.net/v/20171003113739282
http://v.media.daum.net/v/20171003113739282
http://v.media.daum.net/v/20171002104918155
http://v.media.daum.net/v/20170920030430244
http://v.media.daum.net/v/20170916195253268
http://v.media.daum.net/v/20171003080029438
http://v.media.daum.net/v/20171003080029438
http://v.media.daum.net/v/20171003064309891
http://v.media.daum.net/v/20171002091510629
http://v.media.daum.net/v/20171001081313584
http://v.media.daum.net/v/20171003155102944
http://v.media.daum.net/v/20171003150205408
http://v.media.daum.net/v/20171003150205408
http://v.media.daum.net/v/20171003150103393
http://v.media.daum.net/v/20171003150103393
http://v.media.daum.net/v/20171003120004501
http://v.media.daum.net/v/20171002201326119
http://v.media.daum.net/v/20171003130229975
http://v.media.daum.net/v/20171003090202226
http://v.media.daum.net/v/20171003135455460
http://v.media.daum.net/v/20171003072447222
http://v.media.daum.net/v/20171003080207491
http://v.media.daum.net/v/20171002202437207
http://v.media.daum.net/v/20171003074824349
http://v.media.daum.net/v/20171003003052543
http://v.media.daum.net/v/20171003002852538
http://v.media.daum.net/v/20171003075044367
http://v.media.daum.net/v/20171003070402140
http://v.media.daum.net/v/20171003062707812
http://v.media.daum.net/v/20171003075045368
http://v.media.daum.net/v/20171003160221170
http://v.media.daum.net/v/20171003153007719
http://v.media.daum.net/v/20171003153005718
http://v.media.daum.net/v/20171003150205408
http://v.media.daum.net/v/20171003150103393
http://v.media.daum.net/v/20171003145700320
http://v.media.daum.net/v/20171003143124965
http://v.media.daum.net/v/20171003141602754
http://v.media.daum.net/v/20171003140104557
http://v.media.daum.net/v/20171003170153776
http://v.media.daum.net/v/20171003170153776
http://v.media.daum.net/v/20171003170103766
http://v.media.daum.net/v/20171003170103766
http://v.media.daum.net/v/20171003153605777
http://v.media.daum.net/v/20171003134701365
http://v.media.daum.net/v/20171003144300104
http://v.media.daum.net/v/20171003140217573
http://v.media.daum.net/v/20171003165955753
http://v.media.daum.net/v/20171003162829455
http://v.media.daum.net/v/20171003150020382
http://v.media.daum.net/v/20171003133203236
http://v.media.daum.net/v/20171003144943192
http://v.media.daum.net/v/20171003170153776
http://v.media.daum.net/v/20171003163756548
http://v.media.daum.net/v/20171003085005989
http://v.media.daum.net/v/20171003060027639
http://v.media.daum.net/v/20171003144538134
http://v.media.daum.net/v/20171002220823850
http://v.media.daum.net/v/20171003130230976
http://v.media.daum.net/v/20171003151716578
http://v.media.daum.net/v/20171002211223513
http://v.media.daum.net/v/20171003135545472
http://v.media.daum.net/v/20171003172125124
http://v.media.daum.net/v/20171003133006218
http://v.media.daum.net/v/20171003160102140
http://v.media.daum.net/v/20171003141209699
http://v.media.daum.net/v/20171003170049765
http://v.media.daum.net/v/20171003160308178
http://v.media.daum.net/v/20171003154603881
http://v.media.daum.net/v/20171003150106396
http://v.media.daum.net/v/20171003085101997
http://v.media.daum.net/v/20171003155102944
http://v.media.daum.net/v/20171003084922982
http://v.media.daum.net/v/20171003162937466?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003074913353?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003160035129?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003090407291?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003090005103?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003155315989?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003090019122?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003165244705?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003153647783?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003163140487?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003162729448?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003003924574?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003135157429?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003001048431?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003171553975?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003111531046?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003064200889?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003150922491?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003010111683?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003152425660?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003090633331?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003161805373?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003104404614?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003122624739?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003130103956?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003123537802?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003114416328?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003081002606?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003080303506?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003143023951?s=eRIGHT_MANY_TOT=R
http://v.media.daum.net/v/20171003170238781
http://v.media.daum.net/v/20171003171823024
http://v.media.daum.net/v/20171003171859058
http://v.media.daum.net/v/20171003171449955
http://v.media.daum.net/v/20171003171901062
http://v.media.daum.net/v/20171003171750011
http://v.media.daum.net/v/20171003171800014
http://v.media.daum.net/v/20171003164533620
http://v.media.daum.net/v/20171003171826028
http://v.media.daum.net/v/20171003174923716
http://v.media.daum.net/v/20171003162702444
http://v.media.daum.net/v/20171003170445808
http://v.media.daum.net/v/20171003171511963
http://v.media.daum.net/v/20171003171512964
http://v.media.daum.net/v/20171003171828032
http://v.media.daum.net/v/20171003163206492
http://v.media.daum.net/v/20171003093354662
http://v.media.daum.net/v/20171003113209224
http://v.media.daum.net/v/20171003171829033
http://v.media.daum.net/v/20171003171846046
http://v.media.daum.net/v/20171003083238823
http://v.media.daum.net/v/20171003100347086
http://v.media.daum.net/v/20171003113402241
http://v.media.daum.net/v/20171003170719856
http://v.media.daum.net/v/20171003150139401
http://v.media.daum.net/v/20171003173243386
http://v.media.daum.net/v/20171003165100683
http://v.media.daum.net/v/20171003152849696
http://v.media.daum.net/v/20171003173205372
http://v.media.daum.net/v/20171003105358739 |
cs |
String 검색
- 태그가 아닌 문자열 자체로 검색
- 문자열, 정규표현식 등등으로 검색 가능
- 문자열 검색의 경우 한 태그내의 문자열과 exact matching인 것만 추출. 이것이 의도한 경우가 아니라면 정규표현식 사용
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25 |
import re
import requests
from bs4 import BeautifulSoup
res = requests.get('http://v.media.daum.net/v/20171003195315241')
content = res.content
soup = BeautifulSoup(content, 'html5lib')
print(soup.find_all(string = "주성호 기자"))
print(soup.find_all(string = "주성호 기자")[0])
print('\n')
print(soup.find_all('물리'))
print(soup.find_all(string = re.compile('물리'))[0])
================<<실행결과>>================
['주성호 기자']
주성호 기자
[]
'아인슈타인 수수께끼' 푼 美과학자 3인, 노벨물리학상 수상(종합) | Daum 뉴스 |
cs |
반응형
'Python > Python Basic' 카테고리의 다른 글
[unix time] time, datetime, string 변환 방법 (0) | 2018.03.05 |
---|---|
[python] dataframe 모든 column, row 보기 (0) | 2018.01.18 |
크롤링(Crawling)_04 (함수) (0) | 2017.10.02 |
크롤링(Crawling)_03 (HTML page crawling 실습) (0) | 2017.10.02 |
크롤링(Crawling)_02 (API를 이용한 크롤링) (2) | 2017.10.01 |