Domanda Leggi / converti un InputStream in una stringa


Se hai un java.io.InputStream oggetto, come si dovrebbe elaborare quell'oggetto e produrre a String?


Supponiamo che io abbia un InputStream che contiene dati di testo e voglio convertirlo in a Stringquindi, per esempio, posso scriverlo in un file di registro.

Qual è il modo più semplice per prendere il InputStream e convertirlo in a String?

public String convertStreamToString(InputStream is) { 
    // ???
}

3260
2017-11-21 16:47


origine


risposte:


Un buon modo per farlo è usare Apache commons  IOUtils copiare il InputStream in un StringWriter... qualcosa di simile a

StringWriter writer = new StringWriter();
IOUtils.copy(inputStream, writer, encoding);
String theString = writer.toString();

o anche

// NB: does not close inputStream, you'll have to use try-with-resources for that
String theString = IOUtils.toString(inputStream, encoding); 

In alternativa, puoi usare ByteArrayOutputStream se non vuoi mescolare i tuoi Stream e Scrittori


2043
2017-11-21 16:54



Ecco un modo utilizzando solo la libreria Java standard (si noti che lo stream non è chiuso, YMMV).

static String convertStreamToString(java.io.InputStream is) {
    java.util.Scanner s = new java.util.Scanner(is).useDelimiter("\\A");
    return s.hasNext() ? s.next() : "";
}

Ho imparato questo trucco da "Trucchi stupidi dello scanner" articolo. Il motivo per cui funziona è perché Scanner itera su token nel flusso, e in questo caso separiamo i token usando "inizio del limite di input" (\ A) dandoci quindi un solo token per l'intero contenuto del flusso.

Nota, se devi essere specifico sulla codifica del flusso di input, puoi fornire il secondo argomento a Scanner costruttore che indica quale charset usare (ad esempio "UTF-8").

La punta di cappello va anche a Giacobbe, che una volta mi ha indicato il suddetto articolo.

MODIFICATO: Grazie a un suggerimento da parte di Patrick, ha reso la funzione più robusta quando gestiva un flusso di input vuoto. Un'altra modifica: Nixed try / catch, la via di Patrick è più laconica.


2092
2018-03-26 20:40



Riassumi altre risposte Ho trovato 11 modi principali per farlo (vedi sotto). E ho scritto alcuni test delle prestazioni (vedi i risultati di seguito):

Modi per convertire un InputStream in una stringa:

  1. utilizzando IOUtils.toString (Apache Utils)

    String result = IOUtils.toString(inputStream, StandardCharsets.UTF_8);
    
  2. utilizzando CharStreams (Guaiava)

    String result = CharStreams.toString(new InputStreamReader(
          inputStream, Charsets.UTF_8));
    
  3. utilizzando Scanner (JDK)

    Scanner s = new Scanner(inputStream).useDelimiter("\\A");
    String result = s.hasNext() ? s.next() : "";
    
  4. utilizzando Stream API (Java 8). avvertimento: Questa soluzione converte diverse interruzioni di riga (come \r\n) a \n.

    String result = new BufferedReader(new InputStreamReader(inputStream))
      .lines().collect(Collectors.joining("\n"));
    
  5. utilizzando API stream parallela (Java 8). avvertimento: Questa soluzione converte diverse interruzioni di riga (come \r\n) a \n.

    String result = new BufferedReader(new InputStreamReader(inputStream)).lines()
       .parallel().collect(Collectors.joining("\n"));
    
  6. utilizzando InputStreamReader e StringBuilder (JDK)

    final int bufferSize = 1024;
    final char[] buffer = new char[bufferSize];
    final StringBuilder out = new StringBuilder();
    Reader in = new InputStreamReader(inputStream, "UTF-8");
    for (; ; ) {
        int rsz = in.read(buffer, 0, buffer.length);
        if (rsz < 0)
            break;
        out.append(buffer, 0, rsz);
    }
    return out.toString();
    
  7. utilizzando StringWriter e IOUtils.copy (Apache Commons)

    StringWriter writer = new StringWriter();
    IOUtils.copy(inputStream, writer, "UTF-8");
    return writer.toString();
    
  8. utilizzando ByteArrayOutputStream e inputStream.read (JDK)

    ByteArrayOutputStream result = new ByteArrayOutputStream();
    byte[] buffer = new byte[1024];
    int length;
    while ((length = inputStream.read(buffer)) != -1) {
        result.write(buffer, 0, length);
    }
    // StandardCharsets.UTF_8.name() > JDK 7
    return result.toString("UTF-8");
    
  9. utilizzando BufferedReader (JDK). Avvertimento: Questa soluzione converte diverse interruzioni di riga (come \n\r) a line.separator proprietà di sistema (ad esempio, in Windows su "\ r \ n").

    String newLine = System.getProperty("line.separator");
    BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream));
    StringBuilder result = new StringBuilder();
    String line; boolean flag = false;
    while ((line = reader.readLine()) != null) {
        result.append(flag? newLine: "").append(line);
        flag = true;
    }
    return result.toString();
    
  10. utilizzando BufferedInputStream e ByteArrayOutputStream (JDK)

    BufferedInputStream bis = new BufferedInputStream(inputStream);
    ByteArrayOutputStream buf = new ByteArrayOutputStream();
    int result = bis.read();
    while(result != -1) {
        buf.write((byte) result);
        result = bis.read();
    }
    // StandardCharsets.UTF_8.name() > JDK 7
    return buf.toString("UTF-8");
    
  11. utilizzando inputStream.read() e StringBuilder (JDK). avvertimento: Questa soluzione presenta problemi con Unicode, ad esempio con testo russo (funziona correttamente solo con testo non Unicode)

    int ch;
    StringBuilder sb = new StringBuilder();
    while((ch = inputStream.read()) != -1)
        sb.append((char)ch);
    reset();
    return sb.toString();
    

avvertimento:

  1. Le soluzioni 4, 5 e 9 convertono diverse interruzioni di linea in una.

  2. La soluzione 11 non può funzionare correttamente con il testo Unicode

Test delle prestazioni

Test delle prestazioni per piccoli String (lunghezza = 175), url in github (modalità = Tempo medio, sistema = Linux, punteggio 1,343 è il migliore):

              Benchmark                         Mode  Cnt   Score   Error  Units
 8. ByteArrayOutputStream and read (JDK)        avgt   10   1,343 ± 0,028  us/op
 6. InputStreamReader and StringBuilder (JDK)   avgt   10   6,980 ± 0,404  us/op
10. BufferedInputStream, ByteArrayOutputStream  avgt   10   7,437 ± 0,735  us/op
11. InputStream.read() and StringBuilder (JDK)  avgt   10   8,977 ± 0,328  us/op
 7. StringWriter and IOUtils.copy (Apache)      avgt   10  10,613 ± 0,599  us/op
 1. IOUtils.toString (Apache Utils)             avgt   10  10,605 ± 0,527  us/op
 3. Scanner (JDK)                               avgt   10  12,083 ± 0,293  us/op
 2. CharStreams (guava)                         avgt   10  12,999 ± 0,514  us/op
 4. Stream Api (Java 8)                         avgt   10  15,811 ± 0,605  us/op
 9. BufferedReader (JDK)                        avgt   10  16,038 ± 0,711  us/op
 5. parallel Stream Api (Java 8)                avgt   10  21,544 ± 0,583  us/op

Test delle prestazioni per grandi String (lunghezza = 50100), url in github (Modalità = Tempo medio, sistema = Linux, punteggio 200.715 è il migliore):

               Benchmark                        Mode  Cnt   Score        Error  Units
 8. ByteArrayOutputStream and read (JDK)        avgt   10   200,715 ±   18,103  us/op
 1. IOUtils.toString (Apache Utils)             avgt   10   300,019 ±    8,751  us/op
 6. InputStreamReader and StringBuilder (JDK)   avgt   10   347,616 ±  130,348  us/op
 7. StringWriter and IOUtils.copy (Apache)      avgt   10   352,791 ±  105,337  us/op
 2. CharStreams (guava)                         avgt   10   420,137 ±   59,877  us/op
 9. BufferedReader (JDK)                        avgt   10   632,028 ±   17,002  us/op
 5. parallel Stream Api (Java 8)                avgt   10   662,999 ±   46,199  us/op
 4. Stream Api (Java 8)                         avgt   10   701,269 ±   82,296  us/op
10. BufferedInputStream, ByteArrayOutputStream  avgt   10   740,837 ±    5,613  us/op
 3. Scanner (JDK)                               avgt   10   751,417 ±   62,026  us/op
11. InputStream.read() and StringBuilder (JDK)  avgt   10  2919,350 ± 1101,942  us/op

Grafici (test delle prestazioni in base alla lunghezza del flusso di input nel sistema Windows 7)
enter image description here

Test delle prestazioni (tempo medio) in base alla lunghezza del flusso di input nel sistema Windows 7:

 length  182    546     1092    3276    9828    29484   58968

 test8  0.38    0.938   1.868   4.448   13.412  36.459  72.708
 test4  2.362   3.609   5.573   12.769  40.74   81.415  159.864
 test5  3.881   5.075   6.904   14.123  50.258  129.937 166.162
 test9  2.237   3.493   5.422   11.977  45.98   89.336  177.39
 test6  1.261   2.12    4.38    10.698  31.821  86.106  186.636
 test7  1.601   2.391   3.646   8.367   38.196  110.221 211.016
 test1  1.529   2.381   3.527   8.411   40.551  105.16  212.573
 test3  3.035   3.934   8.606   20.858  61.571  118.744 235.428
 test2  3.136   6.238   10.508  33.48   43.532  118.044 239.481
 test10 1.593   4.736   7.527   20.557  59.856  162.907 323.147
 test11 3.913   11.506  23.26   68.644  207.591 600.444 1211.545

1647
2018-02-17 00:58



Apache Commons consente:

String myString = IOUtils.toString(myInputStream, "UTF-8");

Ovviamente, puoi scegliere altre codifiche di caratteri oltre a UTF-8.

Vedi anche: (Documenti)


793
2017-12-08 20:13



Prendendo in considerazione il file si dovrebbe prima ottenere un java.io.Reader esempio. Questo può quindi essere letto e aggiunto a StringBuilder (non abbiamo bisogno StringBuffer se non stiamo accedendo in più thread, e StringBuilder è più veloce). Il trucco qui è che lavoriamo in blocchi, e come tali non hanno bisogno di altri flussi di buffering. La dimensione del blocco è parametrizzata per l'ottimizzazione delle prestazioni in fase di esecuzione.

public static String slurp(final InputStream is, final int bufferSize) {
    final char[] buffer = new char[bufferSize];
    final StringBuilder out = new StringBuilder();
    try (Reader in = new InputStreamReader(is, "UTF-8")) {
        for (;;) {
            int rsz = in.read(buffer, 0, buffer.length);
            if (rsz < 0)
                break;
            out.append(buffer, 0, rsz);
        }
    }
    catch (UnsupportedEncodingException ex) {
        /* ... */
    }
    catch (IOException ex) {
        /* ... */
    }
    return out.toString();
}

263
2017-08-04 08:29



Cosa ne pensi di questo?

InputStream in = / * tuo InputStream * /;
StringBuilder sb=new StringBuilder();
BufferedReader br = new BufferedReader(new InputStreamReader(in));
String read;

while((read=br.readLine()) != null) {
    //System.out.println(read);
    sb.append(read);   
}

br.close();
return sb.toString();

226
2017-07-13 15:56



Se utilizzi Google-Collections / Guava puoi fare quanto segue:

InputStream stream = ...
String content = CharStreams.toString(new InputStreamReader(stream, Charsets.UTF_8));
Closeables.closeQuietly(stream);

Si noti che il secondo parametro (vale a dire Charsets.UTF_8) per il InputStreamReader non è necessario, ma generalmente è una buona idea specificare la codifica se la conosci (cosa che dovresti!)


153
2018-05-08 20:24



Questa è la mia pura soluzione Java e Android, funziona bene ...

public String readFullyAsString(InputStream inputStream, String encoding)
        throws IOException {
    return readFully(inputStream).toString(encoding);
}    

public byte[] readFullyAsBytes(InputStream inputStream)
        throws IOException {
    return readFully(inputStream).toByteArray();
}    

private ByteArrayOutputStream readFully(InputStream inputStream)
        throws IOException {
    ByteArrayOutputStream baos = new ByteArrayOutputStream();
    byte[] buffer = new byte[1024];
    int length = 0;
    while ((length = inputStream.read(buffer)) != -1) {
        baos.write(buffer, 0, length);
    }
    return baos;
}

107
2018-06-10 21:07



Che ne dite di:

import java.io.BufferedInputStream;
import java.io.ByteArrayOutputStream;
import java.io.InputStream;
import java.io.IOException;    

public static String readInputStreamAsString(InputStream in) 
    throws IOException {

    BufferedInputStream bis = new BufferedInputStream(in);
    ByteArrayOutputStream buf = new ByteArrayOutputStream();
    int result = bis.read();
    while(result != -1) {
      byte b = (byte)result;
      buf.write(b);
      result = bis.read();
    }        
    return buf.toString();
}

56
2018-01-01 03:43



Ecco la soluzione più elegante, pura Java (senza libreria) che ho trovato dopo alcune sperimentazioni:

public static String fromStream(InputStream in) throws IOException
{
    BufferedReader reader = new BufferedReader(new InputStreamReader(in));
    StringBuilder out = new StringBuilder();
    String newLine = System.getProperty("line.separator");
    String line;
    while ((line = reader.readLine()) != null) {
        out.append(line);
        out.append(newLine);
    }
    return out.toString();
}

55
2017-09-02 11:50