Jak usunąć 50% linii dzielących pewną wartość kolumny

Question 1

df.groupby(['target']).count()

Celem	dane
Negatywny	103210
Pozytywny	211082

Teraz moje pozytywne dane są zbyt duże. Chcę usunąć 50% wierszy, których znaczenie w Target kolumna jest Positive. Jak mogę to zrobić?

Question 2

Aby zapisać połowę Positive wiersze,sample 50% od Positive wiersze, które także używają frac=0.5 idrop te indeksy:

indexes = df[df.target == 'Positive'].sample(frac=0.5).index
df = df.drop(indexes)

Aby zapisać dokładnie 100 tysięcy Positive wiersze,sample 100K Positive wiersze z wykorzystaniem n=100_000 iconcat ich za pomocą Negative wiersz:

df = pd.concat([
    df[df.target == 'Negative'],
    df[df.target == 'Positive'].sample(n=100_000)
])

tdy · Answer 1 · 2021-11-24T04:27:20

Aby zapisać połowę Positive wiersze,sample 50% od Positive wiersze, które także używają frac=0.5 idrop te indeksy:

indexes = df[df.target == 'Positive'].sample(frac=0.5).index
df = df.drop(indexes)

Aby zapisać dokładnie 100 tysięcy Positive wiersze,sample 100K Positive wiersze z wykorzystaniem n=100_000 iconcat ich za pomocą Negative wiersz:

df = pd.concat([
    df[df.target == 'Negative'],
    df[df.target == 'Positive'].sample(n=100_000)
])

Jak usunąć 50% linii dzielących pewną wartość kolumny

Pytanie

Najlepsza odpowiedź

W innych językach

Ta strona jest w innych językach

Popularne w tej kategorii

Najczęściej zadawane pytania w tej kategorii