df.groupby(['target']).count()
Celem | dane |
---|---|
Negatywny | 103210 |
Pozytywny | 211082 |
Teraz moje pozytywne dane są zbyt duże. Chcę usunąć 50% wierszy, których znaczenie w Target
kolumna jest Positive
. Jak mogę to zrobić?
df.groupby(['target']).count()
Celem | dane |
---|---|
Negatywny | 103210 |
Pozytywny | 211082 |
Teraz moje pozytywne dane są zbyt duże. Chcę usunąć 50% wierszy, których znaczenie w Target
kolumna jest Positive
. Jak mogę to zrobić?
Aby zapisać połowę Positive
wiersze,sample
50% od Positive
wiersze, które także używają frac=0.5
idrop
te indeksy:
indexes = df[df.target == 'Positive'].sample(frac=0.5).index
df = df.drop(indexes)
Aby zapisać dokładnie 100 tysięcy Positive
wiersze,sample
100K Positive
wiersze z wykorzystaniem n=100_000
iconcat
ich za pomocą Negative
wiersz:
df = pd.concat([
df[df.target == 'Negative'],
df[df.target == 'Positive'].sample(n=100_000)
])