Я реализую решение с помощью службы Watson Retrieve & Rank.
Когда я использую интерфейс инструментов, я загружаю свои документы, и они отображаются в виде списка, где я могу щелкнуть любой из них, чтобы открыть все заголовки, которые находятся внутри документа (блоки ответов), как вы можете видеть на Рисунок 1 и Изображение 2.
Когда я пытаюсь загрузить документы через Java, он не распознает документы, они загружаются по частям (блоки ответов как документы), каждая часть как новый документ.
Я хотел бы знать, как я могу загрузить свои документы целиком, а не только его части?
Вот коды для функции загрузки в Java:
public Answers ConvertToUnits(File doc, String collection) throws ParseException, SolrServerException, IOException{
DC.setUsernameAndPassword(USERNAME,PASSWORD);
Answers response = DC.convertDocumentToAnswer(doc).execute();
SolrInputDocument newdoc = new SolrInputDocument();
WatsonProcessing wp = new WatsonProcessing();
Collection<SolrInputDocument> newdocs = new ArrayList<SolrInputDocument>();
for(int i=0; i<response.getAnswerUnits().size(); i++)
{
String titulo = response.getAnswerUnits().get(i).getTitle();
String id = response.getAnswerUnits().get(i).getId();
newdoc.addField("title", titulo);
for(int j=0; j<response.getAnswerUnits().get(i).getContent().size(); j++)
{
String texto = response.getAnswerUnits().get(i).getContent().get(j).getText();
newdoc.addField("body", texto);
}
wp.IndexDocument(newdoc,collection);
newdoc.clear();
}
wp.ComitChanges(collection);
return response;
}
public void IndexDocument(SolrInputDocument newdoc, String collection) throws SolrServerException, IOException
{
UpdateRequest update = new UpdateRequest();
update.add(newdoc);
UpdateResponse addResponse = solrClient.add(collection, newdoc);
}