100% found this document useful (7 votes)
23 views

Download full Challenges in Natural Language Processing Studies in Natural Language Processing First Edition Madeleine Bates (Editor) ebook all chapters

Natural

Uploaded by

penolytsma5
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
100% found this document useful (7 votes)
23 views

Download full Challenges in Natural Language Processing Studies in Natural Language Processing First Edition Madeleine Bates (Editor) ebook all chapters

Natural

Uploaded by

penolytsma5
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
You are on page 1/ 82

Download the full version of the ebook now at ebookultra.

com

Challenges in Natural Language Processing


Studies in Natural Language Processing First
Edition Madeleine Bates (Editor)

https://ebookultra.com/download/challenges-in-
natural-language-processing-studies-in-natural-
language-processing-first-edition-madeleine-bates-
editor/

Explore and download more ebook at https://ebookultra.com


Recommended digital products (PDF, EPUB, MOBI) that
you can download immediately if you are interested.

Semantic Processing for Finite Domains Studies in Natural


Language Processing 1st Edition Martha Stone Palmer

https://ebookultra.com/download/semantic-processing-for-finite-
domains-studies-in-natural-language-processing-1st-edition-martha-
stone-palmer/
ebookultra.com

Bayesian Analysis in Natural Language Processing 2nd


Edition Shay Cohen

https://ebookultra.com/download/bayesian-analysis-in-natural-language-
processing-2nd-edition-shay-cohen/

ebookultra.com

Natural Language Processing with Python 1st Edition Steven


Bird

https://ebookultra.com/download/natural-language-processing-with-
python-1st-edition-steven-bird/

ebookultra.com

Collaborative Annotation for Reliable Natural Language


Processing Technica 1st Edition Fort

https://ebookultra.com/download/collaborative-annotation-for-reliable-
natural-language-processing-technica-1st-edition-fort/

ebookultra.com
Recent Advances in Natural Language Processing III
Selected Papers from RANLP 2003 1st Edition Nicolas
Nicolov
https://ebookultra.com/download/recent-advances-in-natural-language-
processing-iii-selected-papers-from-ranlp-2003-1st-edition-nicolas-
nicolov/
ebookultra.com

The Handbook of Computational Linguistics and Natural


Language Processing 1st Edition Alexander Clark

https://ebookultra.com/download/the-handbook-of-computational-
linguistics-and-natural-language-processing-1st-edition-alexander-
clark/
ebookultra.com

Real World Natural Language Processing Practical


Applications With Deep Learning 1st Edition Masato
Hagiwara
https://ebookultra.com/download/real-world-natural-language-
processing-practical-applications-with-deep-learning-1st-edition-
masato-hagiwara/
ebookultra.com

Natural Language Generation in Interactive Systems 1st


Edition Amanda Stent

https://ebookultra.com/download/natural-language-generation-in-
interactive-systems-1st-edition-amanda-stent/

ebookultra.com

Natural Gas Processing Technology and Engineering Design


1st Edition Alireza Bahadori

https://ebookultra.com/download/natural-gas-processing-technology-and-
engineering-design-1st-edition-alireza-bahadori/

ebookultra.com
Challenges in Natural Language Processing Studies in
Natural Language Processing First Edition Madeleine
Bates (Editor) Digital Instant Download
Author(s): Madeleine Bates (editor), Ralph M. Weischedel (editor)
ISBN(s): 9780521410151
Edition: First Edition
File Details: PDF, 3.53 MB
Year: 2006
Language: english
Studies in Natural Language Processing

Challenges in natural language processing


Studies in Natural Language Processing
Branimir K. Boguraev, Editor

This series publishes monographs, texts, and edited volumes within the inter-
disciplinary field of computational linguistics. It represents the range of topics of
concern to the scholars working in this increasingly important field, whether
their background is in formal linguistics, psycholinguistics, cognitive psycholo-
gy, or artificial intelligence.

Also in this series:


Memory and context for language interpretation by Hiyan Alshawi
The linguistic basis of text generation by Laurence Danlos
Natural language parsing edited by David R. Dowty, Lauri Karttunen, and
Arnold Zwicky
Relational models of the lexicon by Martha Walton Evens
Computational linguistics by Ralph Grishman
Semantic interpretation and the resolution of ambiguity by Graeme Hirst
Reference and computation by Amichai Kronfeld
Machine translation edited by Sergei Nirenburg
Semantic processing for finite domains by Martha Stone Palmer
Systemic text generation as problem solving by Terry Patten
Challenges in
natural language processing

Edited by
MADELEINE BATES
and
RALPH M. WEISCHEDEL
BBN Systems and Technologies
Cambridge, MA

CAMBRIDGE
UNIVERSITY PRESS
CAMBRIDGE UNIVERSITY PRESS
Cambridge, New York, Melbourne, Madrid, Cape Town, Singapore, Sao Paulo

Cambridge University Press


The Edinburgh Building, Cambridge CB2 2RU, UK

Published in the United States of America by Cambridge University Press, New York

www. c ambridge. org


Information on this title: www.cambridge.org/9780521410151
© Cambridge University Press 1993

This publication is in copyright. Subject to statutory exception


and to the provisions of relevant collective licensing agreements,
no reproduction of any part may take place without
the written permission of Cambridge University Press.

First published 1993


This digitally printed first paperback version 2006

A catalogue record for this publication is available from the British Library

Library of Congress Cataloguing in Publication data


Challenges in natural language processing / edited by Madeleine Bates.
Ralph M. Weischedel.
p. cm. — (Studies in natural language processing)
Chiefly papers presented at a symposium held in Cambridge, Mass,
from Nov. 29, 1989 to Dec. 1, 1989 and sponsored by the Science
Development Program of Bolt, Beranek, and Newman, Inc.
Includes index.
ISBN 0-521-41015-0 (hardback)
I. Computational linguistics — Congresses. I. Bates, Madeleine.
II. Weischedel, Ralph M. III. Series.
P98.C45 1992
410'.285-dc20 91-45913
CIP
ISBN-13 978-0-521-41015-1 hardback
ISBN-10 0-521-41015-0 hardback

ISBN-13 978-0-521-03226-1 paperback


ISBN-10 0-521-03226-1 paperback
Contents

Preface page vii


Symposium participants x

Part I. Challenging problems


1 Critical challenges for natural language processing 3
MADELEINE BATES, ROBERT J. BOBROW, and
RALPH M. WEISCHEDEL

Part II. Building a lexicon


2 The contribution of lexicography 37
B. T. SUE ATKINS
3 The contribution of linguistics 76
BETH LEVIN
4 The contribution of computational lexicography 99
BRANIMIR K. BOGURAEV

Part III. Semantics and knowledge representation


5 Events, situations, and adverbs 135
ROBERT C. MOORE
6 Natural language, knowledge representation, and logical form 146
JAMES F. ALLEN

Part IV. Discourse


7 Getting and keeping the center of attention 179
REBECCA J. PASSONNEAU
8 Surface structure, intonation, and discourse meaning 228
MARK STEEDMAN

Part V. Spoken language systems


9 Prosody, intonation, and speech technology 257
JANET PIERREHUMBERT
vi Contents

Part VI. Conclusion


10 The future of computational linguistics 283
MADELEINE BATES and RALPH M. WEISCHEDEL

Author index 289


Subject index 292
Preface

Throughout most of the 1960s, 1970s, and 1980s, computational linguistics


enjoyed an excellent reputation. A sense of the promise of the work to society
was prevalent, and high expectations were justified by solid, steady progress in
research.
Nevertheless, by the close of the 1980s, many people openly expressed doubt
about progress in the field. Are the problems of human language too hard to be
solved even in the next eighty years? What measure(s) (other than the number of
papers published) show significant progress in the last ten years? Where is the
technology successfully deployed in the military, with revolutionary impact? In
what directions should the field move, to ensure progress and avoid stagnation?

The symposium
A symposium on Future Directions in Natural Language Processing was held at
Bolt Beranek and Newman, Inc. (BBN), in Cambridge, Massachusetts, from
November 29, 1989, to December 1, 1989.
The symposium, sponsored by BBN's Science Development Program, brought
together top researchers in a variety of areas to discuss the most significant
problems and challenges that will face the field of computational linguistics in
the next two to ten years. Speakers were encouraged to present both recently
completed and speculative work, and to focus on topics that will have the most
impact on the field in the coming decade. They were asked to reconsider un-
solved problems of long standing as well as to present new opportunities. The
purpose was to contribute to long-range planning by funding agencies, research
groups, academic institutions, graduate students, and others interested in com-
putational linguistics.
The thirty-six symposium attendees, who are listed following this preface,
were all invited participants. They included speakers, respondents to papers, and
people from government, industry, and academia. Though varying greatly in age
and in backgrounds, they all shared a strong interest in computational linguistics.
The format of the meeting provided for one-and-a-half-hour presentations,
much longer than at most conferences, in order to give speakers sufficient time to
present ideas completely. The schedule also allowed plenty of time for lively

vn
viii Preface

discussions. A brief review of the symposium was published by Mark Maybury


in the Summer 1990 issue of AI Magazine.

The papers and the book


We have taken the liberty of arranging the chapters in this book in a slightly
different order than they were presented at the symposium. This allows our own
paper, "Critical Challenges for NLP," to come first, both to set the tone ftv the
subsequent papers and to provide a number of definitions and examples that may
be helpful to readers who are not fully familiar with this field.
The three "traditional" areas of NLP - syntax, semantics, and pragmatics - all
focus on language that is made up of words (or entities very similar to words). It
is curious that the study of words themselves has not traditionally been a major
area of interest in computational linguistics. Perhaps this is because it has always
been assumed that each NL system has its own, usually small (under 5,000
words) lexicon that has been developed by hand for the application under study.
One of the key insights of the BBN symposium is that more attention must be
paid to the development of large, sharable lexicons that are produced specifically
for use by NL systems. Traditional dictionaries have been produced for use in
book form by humans, but this is completely inadequate for computational
applications.
The three papers that form Part II, Building the lexicon, address these issues.
Sue Atkins (Oxford University Press), whose talk was originally titled "Beware
the lexicon" but appears here as "The contribution of lexicography," gives a
lexicographer's view of a proposed structure for lexical entries. Beth Levin
(Northwestern University) provides an analysis of verbs, specifically verbs of
making sound, that allows for the handling of new uses of known words. Bra-
nimir Boguraev (IBM Yorktown Heights) discusses the use of machine-readable
sources to construct thesauri and other knowledge bases.
The areas of semantics and knowledge representation remain closely coupled
and of great import. Robert Moore (SRI International) presents a study of the
adverb, a part of speech that has been largely ignored in the past. James Allen
(University of Rochester) provides an excellent discussion of the use of ambigu-
ity and a related concept, vagueness, in logical form.
The subject of discourse has been receiving increased attention in the past few
years. Rebecca Passonneau (Paramax) addresses this important issue. Mark
Steedman (University of Pennsylvania) originally titled his presentation "Pros-
ody, parsing, and discourse," and thus it is included in the discourse section,
although its title here is "Surface structure, intonation, and discourse meaning."
It has long been the goal of many researchers to integrate speech processing
techniques (such as speech recognition) with natural language processing to
produce systems capable of understanding spoken language. Janet Pierrehumbert
Preface ix

(Northwestern University) argues that a rich model of prosodic structure is neces-


sary to understand how prosody and intonation convey information about atten-
tion and intention.
The book concludes with the results of a lengthy and lively discussion on the
future of computational linguistics. This discussion attempted to enumerate some
of the most important problems to be tackled in the next few years and to describe
what will be needed to solve them.
The papers that were presented at the BBN symposium represent not only cutting-
edge research on familiar topics but also new directions for the field. This is
indicated by the presence of such topics as the lexicon and speech (and the
absence of such topics as parsers and grammars), which would not have been the
case in a similar meeting held even five years ago.
The purpose of this volume is to convey that excitement, to suggest concrete
ideas that the contributing authors think most promising for future research, and
to encourage the readers to pursue ideas for a new generation of NLP technology.

Madeleine Bates
Ralph M. Weischedel
Symposium participants

JAMES F. ALLEN ROBERT MERCER


University of Rochester (s) (r) IBM Research (r)
B. T. SUE ATKINS CHRISTENE MONTGOMERY
Oxford University Press (s) LIS (r)
MADELEINE BATES ROBERT C. MOORE
BBN Systems & Technologies (s) SRI International (s)
ROBERT J. BOBROW REBECCA J. PASSONNEAU
BBN Systems & Technologies (s) (r) Paramax (s)
BRANIMIR K. BOGURAEV JANET PIERREHUMBERT
IBM Research (s) Northwestern University (s)
YEN-LU CHOW JAMES PUSTEJOVSKY
BBN Systems & Technologies Brandeis University (r)
STEPHEN DENNIS RICHARD SCHWARTZ
Department of Defense BBN Systems & Technologies (s)
JOYCE FRIEDMAN STEPHANIE SENEFF
Boston University MIT
JANE GRIMSHAW VARDA SHARED
Brandeis University BBN Systems & Technologies
HENRY HAMBURGER CANDY SIDNER
George Mason University Digital Equipment Corporation (r)
ROBERT J. P. INGRIA NORM SONDHEIMER
BBN Systems & Technologies GE Research (r)
BORIS KATZ MARK STEEDMAN
MIT AI Laboratory University of Pennsylvania (s)
BETH LEVIN MIKE THOMAS
Northwestern University KSC, Inc.
MARK MAYBURY DONALD WALKER
RADC Bellcore (r)

(s) indicates a speaker,


(r) indicates a respondent.
X
Symposium participants xi

SHARON WALTER RALPH M. WEISCHEDEL


RADC BBN Systems & Technologies (s)
RAND WALTZMAN DOUGLAS WHITE
DARPA/ISTO RADC
CHARLES L. WAYNE COLIN WIGHTMAN
DARPA/ISTO Boston University
BONNIE LYNN WEBBER WILLIAM WOODS
University of Pennsylvania Harvard Univesity (r)
PART I

Challenging problems
Critical challenges for natural language processing

MADELEINE BATES, ROBERT J. BOBROW,


AND RALPH M. WEISCHEDEL

1.1 Introduction
Although natural language processing (NLP) has come very far in the last twenty
years, the technology has not yet achieved a revolutionary impact on society. Is
this because of some fundamental limitation that can never be overcome? Is it
because there has not been enough time to refine and apply theoretical work that
has already been done?
We believe it is neither. We believe that several critical issues have never been
adequately addressed in either theoretical or applied work, and that, because of a
number of recent advances that we will discuss, the time is due for great leaps
forward in the generality and utility of NLP systems. This paper focuses on
roadblocks that seem surmountable within the next ten years.
Rather than presenting new results, this paper identifies the problems that we
believe must block widespread use of computational linguistics, and that can be
solved within five to ten years. These are the problems that most need additional
research and most deserve the talents and attention of Ph.D. students. We focus
on the following areas, which will have maximum impact when combined in
software systems:
1. Knowledge acquisition from natural language (NL) texts of various
kinds, from interactions with human beings, and from other sources.
Language processing requires lexical, grammatical, semantic, and prag-
matic knowledge. Current knowledge acquisition techniques are too
slow and too difficult to use on a wide scale or on large problems.
Knowledge bases should be many times the size of current ones.
2. Interaction with multiple underlying systems to give NL systems the
utility and flexibility demanded by people using them. Single applica-
tion systems are limited in both usefulness and the language that is
necessary to communicate with them.

Some of the work reported here was supported by the Advanced Research Projects Agency under
Contracts No. N00014-85-C-0016 and N00014-89-C-008, monitored by the Office of Naval Re-
search. The views and conclusions contained in this document are those of the authors and should not
be interpreted as necessarily representing the official policies, either expressed or implied, of the
Defense Advanced Research Projects Agency of the United States Government.
3
4 M. Bates, R. J. Bobrow, and R. M. Weischedel

3. Partial understanding gleaned from multi-sentence language, or from


fragments of language. Approaches to language understanding that re-
quire perfect input or that try to produce perfect output seem doomed to
failure because novel language, incomplete language, and errorful lan-
guage are the norm, not the exception.
In the following sections, we first present a brief overview of the state of the
art in the traditional areas of syntax, semantics, and pragmatics. Then each of the
three critical challenge topics is discussed in a separate section, beginning with
an explanation of the problem and its importance, and continuing through with
an explanation of the techniques that we believe are now ready to be applied to
those problems. Each section concludes with a summary of the challenges and
the suggested new approaches.

1.2 State of the art


The most visible results in NLP in the last five years are several commercially
available systems for database question-answering. These systems, the result of
transferring technology developed in the 1970s and early 1980s, have been
successfully used to improve productivity by replacing fourth-generation data-
base query languages. The following case study (Bates, 1989) illustrates their
capabilities: with 8-person-weeks, the Parlance™ system1 was ported to a Navy
relational database of 666 fields (from 75 relations) with a vocabulary of over
6,000 (root) words. Queries from a new user of one of these systems succeed 60-
80% of the time; with use of the system, users naturally and automatically adjust
to what data is in the database and to the limits of the language understood by the
system, giving a success rate of 80-95% depending on the individual.
The success of these systems has depended on the fact that sufficient coverage
of the language is possible with relatively simple semantic and discourse models.
The semantics are bounded by the semantics of the relations used in databases
and by the fact that words have a restricted number of meanings in one domain.
The discourse model for a query is usually limited to the previous answer (usu-
ally numeric, simple strings, or a table) and the noun phrases mentioned in the
last few queries.
The limitations of today's practical language processing technology have been
summarized (Weischedel et al., 1990) as follows:
1. Domains must be narrow enough so that the constraints on the relevant
semantic concepts and relations can be expressed using current knowl-
edge representation techniques, i.e., primarily in terms of types and
sorts. Processing may be viewed abstractly as the application of recur-

1
Parlance is a trademark of BBN Systems and Technologies.
Critical challenges for NLP 5

sive tree rewriting rules, including filtering out trees not matching a
certain pattern.
2. Handcrafting is necessary, particularly in the grammatical components
of systems (the component technology that exhibits least dependence on
the application domain). Lexicons and axiomatizations of critical facts
must be developed for each domain, and these remain time-consuming
tasks.
3. The user must still adapt to the machine, but, as the products testify, the
user can do so efTectively.
4. Current systems have limited discourse capabilities that are almost ex-
clusively handcrafted. Thus current systems are limited to viewing in-
teraction, translation, and writing and reading text as processing a
sequence of either isolated sentences or loosely related paragraphs.
Consequently, the user must adapt to such limited discourse.
It is traditional to divide natural language phenomena (and components of
systems designed to deal with them) into three classes:
1. Syntactic phenomena - those that pertain to the structure of a sentence
and the order of words in the sentence, based on the grammatical classes
of words rather than their meaning.
2. Semantic phenomena - those that pertain to the meaning of a sentence
relatively independent of the context in which that language occurs.
3. Pragmatic phenomena - those that relate the meaning of a sentence to
the context in which it occurs. This context can be linguistic (such as the
previous text or dialogue), or nonlinguistic (such as knowledge about
the person who produced the language, about the goals of the communi-
cation, about the objects in the current visual field, etc.).

1.2.1 Syntax
Syntax is without doubt the most mature field of study in both computational
linguistics and the closely related field of linguistics. The most thorough com-
putational accounts of natural language phenomena exist for syntax; and gram-
mars with very large coverage of English have existed since the early 1980s.
Formalisms for describing syntactic phenomena, mathematical analyses of the
expressive power of those formalisms, and computational properties of pro-
cessors for those formalisms have existed for more than twenty-five years, since
the definition of the Chomsky hierarchy (finite state languages, context-free
languages, context-sensitive languages, and the recursively enumerable lan-
guages).
During the 1970s and most of the 1980s, the dominant NLP formalism for
writing grammars of natural language was the augmented transmission network
(ATN) (Woods, 1970), a procedural language that allowed compact statements of
6 M. Bates, R. J. Bobrow, and R. M. Weischedel

not only the context-free aspects of language but also the apparently context-
sensitive aspects as well. In the late 1980s, a shift began from the ATN and its
procedural aspects toward a declarative formalism. What the new dominant
formalism will be is not yet clear, but a likely candidate is a class of grammar
formalisms (Shieber, 1986) that combine context-free rules with unification as a
way of compactly capturing both context-free and context-sensitive aspects of
language. The declarative formalisms offer the promise of exploring alternative
parsing algorithms and pose minimum constraints on parallel algorithms for
parsing. This shift in the research community from procedural specifications of
syntax, such as ATN grammars, to declarative specifications, such as unification
grammars, parallels the similar shift in interest in programming language re-
search away from procedural languages and toward newer functional program-
ming languages and declarative representations.
Because syntax is by far the most mature area in natural language processing,
it is difficult to foresee that further developments in syntax will have as great an
impact on utility as would emphasis on research and development on other, less
developed areas of technology.

1.2.2 Semantics
In semantics, much recent progress has been made by focusing on limited ap-
plication domains. For database access, the semantics of the system can be
confined to that of the individual entities, classes of entities, relationships among
the entities, attributes of the entities, and the typical operations that are per-
formed in database retrieval. This simplifies the problem of semantics in at least
the following ways: first, the meaning of individual words and of the phrases
they compose can be restricted to the domain-specific meanings actually mod-
eled in the database. Instead of needing to come up with a very general semantics
for each word, a very literal semantics providing the mapping from the words to
the entities modeled in the database is all that is required, for the database could
not provide additional information even if a more general semantics were avail-
able. Second, problems of semantic ambiguity regarding alternative senses for a
word are reduced, for only those word senses corresponding to entities in the
database will contribute to the search space of possible alternatives.
For the task of database updating from messages, a key simplifying condition
is that the information sought can be characterized ahead of time. Suppose the
goal is to update automatically a database regarding takeover bids. Suppose
further that the information desired is the date of the bid, the bidder, the target,
the percentage of stock sought, the value of the offer, and whether it is a friendly
or hostile bid. A first approximation is that the remaining information in the
article can be ignored. The assumption is that although other concepts may be
mentioned in the message or news wire item, they normally do not impact the
Critical challenges for NLP 7

values of the fields to be updated in the database. If that assumption applies in the
proposed message processing application, then one can model the literal seman-
tics of those words and phrases that have a correlate in the data being sought. For
cases where the proposed update would be in error because the unanalyzed text
does impact the update, human review of the proposed update can minimize
erroneous entries into the database. Semi-automatic update with a human in the
loop may be more cost effective and timely than fully manual update and may be
more desirable than not having the data at all.
No uniform semantics representation language has emerged, although three
general classes of semantic representations are employed: those that allow one to
state anything that arises in a propositional logic, those that allow expressions
equivalent to a first-order logic, and those that allow expressions not representa-
ble in a first-order logic. Most framed-base representations are equivalent to a
propositional logic, since they do not allow expression of quantifiers. Most
systems for database retrieval use a first-order logic. Many research systems
employ extensions beyond first-order logic, such as the modal intensional logic
defined by Montague (1970). Encoding the semantics of all the words and
phrases for a particular application domain is one of the most significant costs in
bringing up a natural language system in a new application domain. Knowledge
acquisition procedures that would reduce this cost would therefore have great
impact on the applicability of the technology.

1.2.3 Pragmatics
The modeling of context and using context in understanding language is the most
difficult, and therefore the least well-understood, area of natural language pro-
cessing. Unlike programming languages where one can define contextual influ-
ence in a limited and controlled way, context is all-pervasive and very powerful
in natural language communication.
Context is fundamental to communicating substantial information with few
words. For instance, if one says, How about Evans?, those three words may
suggest a lot. If the context had been that the immediately previous request was
List the salary, highest degree, race, and marital status of Jones, then How
about Evans? means List the salary, highest degree, race, and marital status of
Evans. If the context has been your boss saying / need someone to go to Phoenix
next week without jeopardizing meeting the XYZ deadline, then How about
Evans? means Consider Evans for going to Phoenix next week without jeopardiz-
ing meeting the XYZ deadline.
The single phenomenon that has received the most attention in pragmatics is
pronominal or other referring expressions. Progress has been substantial enough
that pronouns it, they, those, etc.) and definite reference {those submarines, the
first three men, etc.) can be used rather freely in today's systems.
8 M. Bates, R. J. Bobrow, and R. M. Weischedel

1.3 Knowledge acquisition for language processing


It goes without saying that any NLP system must know a fair amount about words,
language, and some subject area before being able to understand language.
Currently, virtually all NLP systems operate using fairly laboriously hand-built
knowledge bases. The knowledge bases may include both linguistic knowledge
(morphological, lexical, syntactic, semantic, and discourse) and nonlinguistic
knowledge (semantic world knowledge, pragmatic, planning, inference), and the
knowledge in them may be absolute or probabilistic. (Not all of these knowledge
bases are necessary for every NLP system.)

13.1 Types of knowledge


Typically, porting a NLP system to a new domain requires acquiring knowledge
for the domain-dependent modules, which often include:
Domain model. The major classes of entities in the domain and the
relations among them must be specified. In a Navy command and con-
trol domain, example concepts are Naval unit, vessel, surface vessel,
submarine, carrier, combat readiness ratings, and equipment classes.
Class-subclass relationships must be specified, e.g., every carrier is a
surface vessel, and every surface vessel is a vessel and a Naval unit.
Other important relationships among concepts must be specified. For
instance, each vessel has a single overall combat readiness rating, and
each Navy unit has an equipment loadout (a list of equipment classes).
Lexical syntax. Syntactic information about each word of the domain
includes its part of speech (e.g., noun, verb, adjective, adverb, proper
noun), its related forms (e.g., the plural of ship is regular ships, but the
plural of sheep and child are irregular sheep and children), and its
grammatical properties (e.g., the verb sleep is intransitive).
Lexical semantics. For each word, its semantics must be specified as a
concept in the domain model, a relation in the domain model, or some
formula made up of concepts and relations of the domain model.
Mappings to the target application. Transformations specify how to map
each concept or relation of the domain model into an appropriate piece of
code for the underlying application system. For example, to find out whether
a given vessel is equipped with helicopters, one might have to check
whether there is a " Y" in the HELO field of the VES table of the database.
Currently, domain-independent knowledge is usually hand-built and is not re-
acquired when moving to a new domain, although it may be necessary to
"tweek" rules and extend this knowledge, again, often by hand. It includes:
Grammar rules. Most rules of English grammar are domain independent,
but almost every domain encountered in practice either turns up instances
Critical challenges for NLP 9

of general rules that had not been encountered in previous domains, or


requires that some domain-specific additions be made to the grammar.
General semantic interpretation rules. Some semantic rules may be con-
sidered to be domain independent, such as the general entity/property re-
lationship that is often expressed with the general verb "have" or the general
preposition " of." To the extent that such general rules can be found and em-
bedded in a system, they do not have to be redone for every new domain.

The success of all current NLP systems depends on what we call the Limited
Domain Assumption, which may be stated as follows: one does not have to
acquire domain-dependent information about words that do not denote some
concept or relation in the domain. Another way of looking at this assumption is
that it says understanding can be confined to a limited domain. The Limited
Domain Assumption simplifies the problem of NLP in three ways: (1) formal
modeling of the concepts and relationships of the domain is feasible, (2) enumer-
ation of critical nonlinguistic knowledge is possible, and (3) both lexical and
semantic ambiguity are limited. Reducing lexical ambiguity reduces the search
space and improves effectiveness of most NL systems.
Those three facts have the combined effect of making it more tractable to
determine what the user meant by a given input, among a welter of possibilities.
But whether one tries to loosen the domain restrictions or is willing to live within
them, it seems obvious (although we will examine this assumption later) that the
more knowledge that is available to the system, the better its chances of under-
standing its input.

1.3.2 Types of knowledge acquisition


Just as there are many kinds of knowledge, there are a number of different ways
of acquiring that knowledge:

Knowing by being pre-programmed - this includes such things as hand-


built grammars and semantic interpretation rules.
Knowing by being told - this includes things that a human can "tell" the
system using various user-interface tools, such as semantic interpreta-
tion rules that can be automatically built from examples, selectional
restrictions, and various lexical and morphological features.
Knowing by looking it up - this means using references such as an on-
line dictionary, where one can find exactly the information that is being
sought.
Knowing by using source material - this means using references such as
an encyclopedia or a corpus of domain-relevant material, from which
one might be able to find or infer the information being sought; it may
also mean using large volumes of material as the source of probabilistic
10 M. Bates, R. J. Bobrow, and R. M. Weischedel

Knowledge Pre- Being Told Look It From Figure It Combined


Type Program Up Sources Out

Lexical 0 0 X X X X
(morph, etc)

Grammar 0
rules

Select, 0 0 X
restrict.

Domain 0 o X X X
semantics

Real world 0 0 X X
semantics

Plans 0 o

Inference 0

Figure 1.1. How natural language systems acquire knowledge, today (o) and in the near future (X).

knowledge (e.g., "bank" is more likely to mean a financial institution


than the side of a river).
Knowing by figuring it out - this means using heuristics and the input
itself (such as the part of speech of words surrounding an unknown word).
Knowing by using a combination of the above techniques - this may or
may not involve human intervention.
Figure 1.1 shows, for a typical NLP system of the 1980s, which knowledge
bases are derived from which processes, and where we expect significant
changes in the near future. Notice that the ways of learning do not necessarily
correspond to the types of knowledge in any direct way. Certainly all of the types
of knowledge can be pre-programmed into an NLP system; indeed that is how
most of the current systems were created. It is a fairly simple step from that to
learning by being told - usually all that is needed is a nice user interface for
creating the same structures that can be pre-programmed. It is not until we reach
the level of knowing by looking it up that it seems right to use the word "learn-
ing" to describe what is going on.
The two areas of particular interest here are learning from sources, and learning
by figuring it out, or some combination of these with learning by being told by a
human being reserved for situations that cannot be covered by the other means.

Learning by looking it up
It is hard to learn by looking it up or from sources, but it is going to get easier.
On-line dictionaries and other reference books have been available for many
years, as have bodies of text such as news wires and technical abstracts, but they
Critical challenges for NLP 11

have not enjoyed wide usage. Why not? It is not entirely a matter of cost, or
speed of access. We believe there are four fundamental reasons why computa-
tional linguists have been avoiding these sources:
1. The required information is often not there.
2. Information is hard to extract from the sources.
3. Once extracted, the information is hard to use.
4. The information is often incomplete and/or incorrect.
Most domains use common English words with specialized meanings. For
example, most dictionaries contain definitions of the words "virus" and
"worm," but not with the meanings that are current in the computer industry.
Even if a word is found with its appropriate meaning, the dictionary entry may
lack information that is critical to the NL system (e.g., selectional restric-
tions). And if the word is found in a corpus of source material, how is the
meaning to be inferred? As a larger volume of domain-specific material becomes
available for many domains, this problem may be reduced, but it will always be
with us.
Extracting detailed information about words or concepts from the kind of text
found in dictionaries and encyclopedias is an enticing prospect, but it presents a
chicken-and-egg problem. A system cannot read a dictionary or encyclopedia
entry unless it knows all the words in the definition (and usually a great deal
more). Since language of this type is often beyond the capabilities of NL systems
(particularly those built on the premise that the input and output must be com-
plete), NLP systems typically cannot read the reference material. One solution to
this problem is to pre-process the reference material, as is being done by Mitch
Marcus at the University of Pennsylvania in an effort to produce text roughly
annotated with part of speech and syntactic structure.
Another solution is to relax the constraints on input and output of NLP sys-
tems, and to develop partial understanders that can glean some information from
sources and, using that information, can re-read the sources to increase their
understanding by bootstrapping. Recent work by Will Crowther (1989) has taken
this approach quite successfully.

Learning from sources


Does knowing more mean that understanding is easier, or harder?
Suppose we solve the problem of extracting information about words and other
things from reference books. Will that automatically mean that our NLP systems
will perform better? There is strong evidence that this is not the case - because
the increased lexical, syntactic, and semantic alternatives that are introduced by
knowing, for example, all the parts of speech and all the possible meanings of all
the words in a sentence can easily swamp a NL processor with an explosion of
possible alternatives to explore, and unresolvable ambiguities may arise when
exploring even just a few!
12 M. Bates, R. J. Bobrow, and R. M. Weischedel

The last major reason for avoiding source material is that such sources, mas-
sive as they are, are inevitably incomplete and incorrect. Nearly all NLP systems
deal with specific limited domains, generally rather technical domains (weather
forecasts, Navy messages, banking, etc.) in which ordinary English words are
given special or restricted meanings. Thus general sources such as dictionaries
give meanings that are misleading or actually wrong, but the NLP system has no
way of knowing this. It would be far better for the sources to have no information
than to have the wrong information, but that is not realistic or even remotely
possible.
Our conclusion is that dictionary and other source information will not be
useful unless we learn how to focus NL processing, order meanings and partially
understood phrases, and interact with other knowledge sources (including hu-
mans) when necessary. Fortunately, there are several ways of achieving these
goals, including:
1. Representing ambiguity at many levels of processing in a computa-
tionally tractable way.
2. Using statistical probabilities at many levels to order choices and cut off
low likelihood paths.

Learning by being told


Some situations will always call for learning by being told. To illustrate this,
consider the following sentence:
Sebastian compensated his Glock.
Do you know what that means? What can you figure out, and how? Presum-
ably you know that Sebastian is a male's name, although if you did not know
that, you might find it out by consulting a good dictionary with a list of names.
You already know the verb "compensate" (or can look it up), with meanings
roughly comparable to "pay" and "make up for"; the latter meaning is unlikely
since it requires a for-clause. The word "Glock" is a stumper. You are unlikely to
find it in any dictionary or encyclopedia you have handy. It seems to be a proper
noun, judging from the capitalization. You might guess that it is a person's name,
although the use of the possessive pronoun with a proper name is quite unusual,
and would probably carry some special meaning that cannot be figured out from
the sentence itself. Perhaps you have some other hypothesis about the word
"Glock". The point is, without help from a human being knowledgeable about
the subject area (or an extremely specialized dictionary), you are unlikely to
figure out what that sentence means, even with considerable effort.
Adding context is not necessarily a help! Suppose the sentence had come to
you as part of a message which said, in its entirety:
Henry and Sebastian were rivals, each preparing for the upcoming competition in his own
way. In order to improve his chances, Henry practiced hard. Sebastian compensated his
Critical challenges for NLP 13

Glock. Lyn didn't think this would help, and advocated more practice instead, but Sebas-
tian pursued his plan single-mindedly.
There is quite a lot of information in that paragraph, but nothing that is very
helpful in figuring out about compensating Glocks.
But if you are told that Glock is a firearms manufacturer (and therefore can be
used to refer generically to any firearm they produce, as is the case with Colt),
and that certain guns can have a device called a compensator installed to reduce
the recoil when they are fired, then you can probably figure out that Sebastian
compensated his Glock means that Sebastian had a compensator added to his
Glock pistol. There is no good alternative to being told this information.
The hard part is not developing rules to infer the meaning of XXXed from
XXXor; such rules have been known for a long time. The hard part is to know
when to apply those rules, and how to keep hundreds of those rules from
interacting to produce more fog than clarity.

1.3.3 New approaches to knowledge acquisition


A breakthrough in the effectiveness and applicability of knowledge acquisition
procedures may be possible within the next five years. In this section the follow-
ing two research approaches are identified:

1. Employing large, growing knowledge bases acquired from reference


texts such as dictionaries. This contributes to robustness by facilitating
acquisition of knowledge for semantic and pragmatic components.
2. Acquisition of syntactic, semantic, and discourse facts from annotated
bodies of language. This contributes to robustness of syntactic, seman-
tic, and discourse components and allows semi-automatic learning of
syntactic and semantic knowledge.

Knowledge from text


Recently a handful of efforts have focused on creating large knowledge bases of
common facts. The CYC project at MCC is employing ten to twenty programmers
to handcraft a knowledge base based on a selection of encyclopedia articles
(Lenat et al., 1986). At IBM Yorktown Heights (Chodorow, Ravin, and Sachar,
1988; Jensen and Binot, 1988; NerT and Boguraev, 1989) and Bell Communica-
tions Research, efforts are underway to derive automatically synonym sets, lex-
ical syntax, and other information from on-line dictionaries. One effort underway
at BBN is the Common Facts Data Base (CFDB) (Crowther, 1989), which has
been used to derive common facts from dictionaries and is being applied experi-
mentally to other reference material.
In this section we illustrate two of the many ways such automatically derivable
databases can increase robustness compared to today's systems. A long-standing
14 M. Bates, R. J. Bobrow, and R. M. Weischedel

problem is the interpretation of nominal compounds, sequences of nouns such as


carrier task force. Heretofore one had to handcraft a definition for each example
or small class of examples. Some informal definitions are provided directly in
dictionaries for frequently occurring, well-known expressions, e.g., fire engine.
These may be automatically derivable by analyzing a dictionary. Others follow
regular patterns (Ayuso, 1985; Finin, 1980), such as part-whole relations, which
require common facts in order to be interpreted. For example, if the NLP system
encounters helicopter rotor for the first time, it could be understood if the
knowledge base contains the information that a rotor is part of a helicopter.
Another long-standing problem is interpreting definite references. The use of
syntactic information to constrain and rank what an anaphoric expression can
refer to is rather well understood. References involving the same terminology are
also rather well understood, e.g., using those ships as a short form after mention-
ing all Cl surface ships in the Indian Ocean. However, the class of references
that illustrates non-robustness in current discourse components are those that
require a "bridge" (Clark, 1975) between what is mentioned, e.g., a connection
between the expression the flight deck, and the expression that implies its exis-
tence, e.g., the carrier Midway. One hypothesis is that bridges fall into one of
potentially a few dozen patterns, in this case, referring to a part after mentioning
the whole. The common fact needed is that aircraft carriers have a flight deck.
Such bridges require large volumes of common, mundane facts, such as those
that might be derived from a dictionary, glossary, or parts manual.
Both nominal compounds and discourse anaphora seem to fall into a few dozen
semantic patterns, each of which assumes a large set of common facts. It has
been easy to implement such semantic patterns for some time; what has been
lacking is a way to derive automatically the large set of common facts assumed.

Linguistic analysis of large bodies of text


NLP research has been hampered by a lack of sufficient linguistic data to derive
statistically significant patterns. Volumes of text are available on-line; the prob-
lem has been how to derive linguistic facts from unanalyzed text. However,
through a DARPA-funded effort at the University of Pennsylvania, corpora of
annotated text will be available to other research sites. The annotations will
include parts of speech and phrasal structure, e.g., syntactic structure. This
syntactically annotated corpus should make two new developments feasible:
1. Development of acquisition procedures to learn new grammar rules for
expressions never seen before by the NLP.
2. Collection of statistics regarding constructions and their probability of
occurrence in context.
Automatic acquisition will reduce the need for handcrafting of both grammars
and lexicons (the formal model of dictionary information for an NLP).
Critical challenges for NLP 15

Original text:
Collection of statistics regarding constructions and their probability of
occurrence in context.
Part of Speech Tagging:

Collection Noun ofpr e p statistics NOun regarding p r e p constructions Npun


and conjunction their P™ probability Noun ofpr e p occurrence Noun in Prep
context Noun
Structure Tagging:

[Collection [of [statistics [regarding [ [constructions]NP and


[their probability [of [occurrence [in [context]NP ]pp ]NP
]pp INP INP ] P P INP IPP INP

Figure 1.2. Examples of two types of tagging.

Example annotations of the type of syntactic information that might be useful


appear in Figure 1.2.
Any rules implicit in the annotation but not present in the current grammar are
candidates to be automatically added to the grammar.
The annotations also allow acquisition of lexical information; for words not in
the system dictionary, the annotations state part of speech and the syntactic
context in which they occur. Suppose regarding were not known to the system
before it encountered the annotated example above; this word could be added to
the system lexicon as a preposition through processing the annotated example.
Thus, annotations provide data that can be used to create systems that adapt by
acquiring grammar rules and information about new words.

Summary

The challenge: To develop ways of acquiring knowledge in such a way as to


permit focusing parsing and semantic interpretation without combinatorial explo-
sion.

The new approach: Glean probabilistic information from bodies of text. Develop
ways to combine automatically acquired knowledge with "being told" by hu-
mans. Use disjunctive processing, merging alternatives at all levels, guided by
probabilistics and using cutoffs to reduce the number of alternatives considered.
(Also use the understanding-by-fragments approach outlined in Section 1.5 of
this chapter.)

1.4 Interfacing to multiple underlying systems


Most current NL systems, whether accepting spoken or typed input, are designed
to interface to a single homogeneous underlying system; they have a component
16 M. Bates, R. J. Bobrow, and R. M. Weischedel

geared to producing code for that single class of application systems, such as a
relational database (Stallard, 1987; Parlance User Manual, Learner User Man-
ual). These systems take advantage of the simplicity of the semantics and the
availability of a formal language (relational calculus and relational algebra) for
the system's output.
The challenge is to recreate a systematic, tractable procedure to translate from
the logical expression of the user's input to systems that are not fully relational,
such as expert system functions, object-oriented and numerical simulation sys-
tems, calculation programs, and so on. Implicit in that challenge is the need to
generate code for non-homogeneous software applications - those that have
more than one application system.
The norm in the next generation of user environments will be distributed,
networked applications. A seamless, multi-modal, NL interface will make use of
a heterogeneous environment feasible for users and, if done well, transparent.
Otherwise, the user will be limited by the complexity, idiosyncrasy, and diversity
of the computing environment.
Such interfaces will be seamless in at least two senses:
1. The user can state information needs without specifying how to decom-
pose those needs into a program calling the various underlying systems
required to meet those needs. Therefore, no seams between the underly-
ing systems will be visible.
2. The interface will use multiple input/output modalities (graphics,
menus, tables, pointing, and natural language). Therefore, there should
be no seams between input/output modalities.
In military uses, we expect that the need to access several heterogeneous
application systems will arise as the norm in command and control, in logistics,
and in contract management. Because of the need to include previously existing
application software, each having its own assumptions regarding operating sys-
tems, heterogeneous software environments will arise. Because of the relative
performance-cost trade-offs in workstations, mainframes, and parallel hardware,
the hardware equipment will be heterogeneous as well.
For example, in DARPA's Fleet Command Center Battle Management Program
(FCCBMP), several applications (call them underlying systems) are involved,
including a relational database (IDB), two expert systems (CASES and FRESH),
and a decision support system (OSGP). The hardware platforms include worksta-
tions, conventional time-sharing machines, and parallel mainframes. Suppose
the user asks Which of those submarines has the greatest probability of locating
A within 10 hours? Answering that question involves subproblems from several
underlying applications: the display facility (to determine both what those sub-
marines means and to display those which fulfill the user's request); FRESH to
calculate how long it would take each submarine to get to the area A; CASES, for
an intensive numerical calculation estimating the probabilities; and the display
facility again, to present the response.
Critical challenges for NLP 17

Although acoustic and linguistic processing can determine what the user
wants, the problem of translating that desire into an effective program to achieve
the user's objective is a challenging, but solvable problem.
In order to deal with multiple underlying systems, not only must our NL
interface be able to represent the meaning of the user's request, but it must also
be capable of organizing the various application programs at its disposal, choos-
ing which combination of resources to use, and supervising the transfer of data
among them. We call this the Multiple Underlying Systems (MUS) problem.
BBN's approach and results on the MUS problem are part of the back end of the
Janus natural language interface and are documented in Resnik (1989).

1.4.1 The scope of the problem


In our view of access to multiple underlying systems, the user's request, what-
ever its modality, is translated into an internal representation of the meaning of
what the user needs. We initially explored a first-order logic for this purpose;
however, in Janus (Weischedel, 1987) we have adopted an intensional logic
(Hinrichs et al., 1987; Weischedel, 1989) to investigate whether intensional logic
offers more appropriate representations for applications more complex than
databases, e.g., simulations and other calculations in hypothetical situations.
From the statement of what the user needs, we next derive a statement of how to
fulfill that need - an executable plan composed of abstract commands. The
executable plan is in essence an abstract data-flow program on a virtual machine
that includes the capabilities of all of the application systems. At the level of that
virtual machine, specific commands to specific underlying systems are dis-
patched, results from those application systems are composed, and decisions are
made regarding the appropriate presentation of information to the user.
Thus, the Multiple Underlying Systems (MUS) problem is a mapping,
MUS: Semantic representation —» Program
that is, a mapping from what the user wants to a program to fulfill those needs,
using the heterogeneous application programs' functionality.
Although the statement of the problem as phrased above may at first suggest
an extremely difficult and long-range program of research in automatic program-
ming (e.g., see Rich and Waters, 1988), there are several ways one can narrow
the scope of the problem to make utility achievable. Substantially restricting the
input language is certainly one way to narrow the problem to one that is tractable.
In contrast, we allow a richer input language (an intensional logic), but assume
that the output is a restricted class of programs - acyclic data-flow graphs. We
assume that all primitives of the logic have a defined transformation from the
level of the statement of the user's needs to the level of the executable plan. That
definition will have been elicited from the application system experts (e.g.,
expert system builders, database administrators, and systems programming staff
of other application systems).
18 M. Bates, R. J. Bobrow, and R. M. Weischedel

A way to paraphrase the effect of assuming acyclic data-flow graphs as the


output of the component is that the programs generated will be assumed to
include
Functions available in the underlying applications systems,
Routines pre-programmed by the application system staff, and
Operators on those elements such as: functional composition, if-then-
else, operators from the relational algebra, and MAPCAR.
Therefore, the system need not derive programs for terms that it does not
already know. Contrast that with the general automatic programming problem.
Suppose that someone says to the system Find the square root of the sum of the
squares of the residuals, so that the input can be correctly translated into a logical
form, but that the underlying applications do not provide a square-root function.
Then the interface will not be expected to derive a square-root program from
arithmetic functions. Rather, this system will be expected to respond / don't
know how to compute square root. Furthermore, if all the quantifiers are assumed
to be restricted to finite sets with a generator function, then the quantifiers can be
converted to simple loops over the elements of sets, such as the mapping oper-
ators of Lisp, rather than having to undertake synthesis of arbitrary program
loops.
Even with these simplifying assumptions, there are interesting problems re-
maining, and the work offers highly desirable utility. The utility arises from two
dimensions:
1. It frees the user from having to identify for each term (word) pieces of
program that would carry out their meaning, for the application system
programmers would do that for some appropriate set of terms.
2. It provides good software engineering of the interface, so that table
input/output functionality, for instance, is insulated from the details of
the underlying application or applications as they evolve.

1.4.2 Approach
The problem of multiple systems may be decomposed into the following sub-
problems:
Representation. It is necessary to represent underlying system ca-
pabilities in a uniform way, and to represent the user request in a form
independent of any particular underlying system. The input/output con-
straints for each function of each underlying system must be specified,
thus defining the services available.
Formulation. One must choose a combination of underlying system
services that satisfies the user request. Where more than one alternative
Critical challenges for NLP 19

exists, it is preferable to select a solution with low execution costs and


low passing of information between systems.
Execution. Actual calls to the underlying systems must be accom-
plished, information must be passed among the systems as required, and
an appropriate response must be generated.

Representing the semantics of utterances


Since the meaning of an utterance in Janus is represented as an expression in
WML (World Model Language [Hinrichs et al., 1987], an intensional logic, the
input to the MUS component is in WML. The choice of WML was based on two
grounds: first and foremost, although we found first-order representations ade-
quate (and desirable) for NL interfaces to relational databases, we felt a richer
semantic representation was important for future applications. The following
classes of representation challenges motivated our choice: explicit representa-
tions of time and world, for instance, to support object-oriented simulation
systems and expert systems involving hypothetical worlds; distributive/collective
readings; generics, and mass terms; and propositional attitudes, such as state-
ments of user preference and belief. Our second motivation for choosing inten-
sional logic was our desire to capitalize on other advantages we perceived for
applying intensional logic to natural language processing (NLP), such as the
potential simplicity and compositionality of mapping from syntactic form to
semantic representation and the many studies in linguistic semantics that assume
some form of intensional logic.
For a sentence such as Display the destroyers within 500 miles of Vinson, the
WML is as follows:
(bring-about
((intension
(exists ?a display
(object-of ?a
(iota ?b (power destroyer)
(exists ?c
(lambda (?d) interval
(& (starts-interval ?d VINSON)
(less-than
(iota ?e length-measure
(interval-length ?d ?e))
(iota ?f length-measure
(& (measure-unit ?f miles)
(measure-quantity ?f 500))))))
(ends-interval ?c ?b))))))
TIME WORLD))
20 M. Bates, R. J. Bobrow, and R. M. Weischedel

Representing the functions of the applications


To represent the functional capabilities of underlying systems, we define services
and servers. A server is a functional module typically corresponding to an under-
lying system or a major part of an underlying system. Each server offers a
number of services: objects describing a particular piece of functionality pro-
vided by a server. Specifying a service in MUS provides for the mapping from
fragments of logical form to fragments of underlying system code. For instance,
the following is a list of services in a naval application. Each service has associ-
ated with it the server it is part of, the input variables, the output variables, the
conjuncts computed, and an estimate of the relative cost in applying it.
Land-avoidance-distance:
owner: Expert System 1
inputs: (x y)
locals: (z w)
pattern:
((in-class x vessel)
(in-class y vessel)
(in-class z interval)
(in-class w length-measure)
(starts-interval z x)
(ends-interval z y)
(interval-length z w))
outputs: (w)
method: ((route-distance (location-of x) (location-of y)))
cost: 5
Great-circle-distance:
owner: Expert System 1
inputs: (x y)
locals: (z w)
pattern:
((in-class x vessel)
(in-class y vessel)
(in-class z interval)
(in-class w length-measure)
(starts-interval z x)
(ends-interval z y)
(interval-length z w))
outputs: (w)
method: ((gc-distance (location-of x) (location-of y)))
cost: 1
Critical challenges for NLP 21

In the example above, there are two competing services for computing dis-
tance between two ships: Great-circle-distance, which simply computes a great
circle route between two points, and Land-avoidance-distance, which computes
the distance of an actual path avoiding land and sticking to shipping lanes.

Clause lists

Usually, the applicability of a service is contingent on several facts, and therefore


several propositions must all be true for the service to apply. To facilitate match-
ing the requirements of a given service against the needs expressed in an utter-
ance, we convert expressions in WML to a disjunction normal form (DNF), i.e., a
disjunction of conjunctions where quantifiers and higher level operators have
been removed. We chose DNF because:

In the simplest case, an expression in disjunctive normal form is simply


a conjunction of clauses, a particularly easy logical form with which to
cope.
Even when there are disjuncts, each can be individually handled as a
conjunction of clauses, and the results then combined together via
union, and
In a disjunctive normal form, each disjunct effectively carries all the
information necessary for a distinct subquery.

For details of the algorithm for converting an intensional expression to DNF, see
Resnik, (1989). For the sentence Display the destroyers within 500 miles of
Vinson, whose WML representation was represented earlier, the clause list is as
follows:
((in-class ?a display)
(object-of ?a ?b)
(in-class ?b destroyer)
(in-class ?c interval)
(in-class ?d interval)
(equal ?c ?d)
(starts-interval ?d VINSON)
(in-class ?e length-measure)
(interval-length ?d ?e)
(in-class ?f length-measure)
(measure-unit ?f miles)
(measure-quantity ?f 500)
(less-than ?e ?f)
(ends-interval ?c ?b))
22 M. Bates, R. J. Bobrow, and R. M. Weischedel

IDB I FRESH I LISP I CASES

(Find-destroyers) — • - ( location-of) ^ ^ ^ ^
^ ^ I Inter-ship- 1 ^^f, T~^\ ^^ f disnlav- "
, , . .mr I distance' J — • Q e s s - t h a n ) — • r JJJPjW
v v
(Find-named vessel ) — • • (Jocation-ofJ -""^ ^

Figure 1.3. A data-flow graph.

If one takes the input request to be a conjunction of requirements, finding the


services to fulfill the request may be viewed as a form of covering problem: one
seeks a plan of execution that satisfies all requirements at minimal cost.
A search is required both to find collections of services that fulfill the request,
and to find a low cost solution. A beam search is used.
Inherent in the collection of services covering a DNF expression is the data
flow that combines the services into a program to fulfill the DNF request. The
next step in the formulation process is data-flow analysis to extract the data-flow
graph corresponding to an abstract program fulfilling the request.
In Figure 1.3, the data-flow graph for Display the destroyers within 500 miles
of Vinson is pictured.
Note that the integrated database (IDB) is called to identify the set of all
destroyers, their locations, and the location of Vinson. An expert system FRESH
is being called to calculate the distance between pairs of locations using land-
avoidance routes. A LISP utility for comparing measures is called, followed by
the display command in the CASES system.

Execution
The execution phase has two purposes:
1. Walk through the data-flow graph, calling operators in the underlying
systems corresponding to the nodes of the graphs.
2. Supply functions for data combination not available in any of the under-
lying systems. In our example, a general function for comparing two
measures, performing the appropriate unit conversions, was assumed.
Previous approaches to the multiple systems problem seem to have assumed
that the data-flow model passes streams of values. This is not always adequate; in
many cases, it is necessary to pass sets of tuples rather than sets of values, using
a generalization of the join operation to combine data. The details of this are
provided in Resnik (1989).
Most previous work dealt with simpler problems, e.g., access to a single
Critical challenges for NLP 23

relational database. Two pioneering efforts at Honeywell and at USC/Information


Sciences Institute dealt with multiple systems but under a highly restrictive
assumption: the user request had to be expressible as a conjunction of simple
relations, equivalent to the select/project/join operations of a relational algebra.
That restriction is removed in Janus. The class of formal expressions handled
includes those involving negation of elementary predicates, existential and uni-
versal quantification, cardinality, and some common disjunctions, as well as
queries that are simply conjunctions of clauses. Wh-questions (who, what, when
where, etc.), commands, and yes/no queries are handled.

Experience in applying the system


The MUS component has been applied in the domain of the Fleet Command
Center Battle Management Program (FCCBMP), using an internal version of the
Integrated Database (IDB) - a relational database - as one underlying resource,
and a set of LISP functions as another. The system includes more than 800
services.
An earlier version of the system described here was also applied to provide
natural language access to data in Intellicorp's KEE knowledge-base system, to
objects representing hypothetical world-states in an object-oriented simulation
system, and to LISP functions capable of manipulating this data.
We have begun integrating the MUS component with BBN's Spoken Language
System HARC (Hear And Respond to Continuous speech).

1.4.3 MUS conclusions


We have found the general approach depicted in Figure 1.3 quite flexible. The
approach was developed in work on natural language processing; however, it
seems to be valuable for other types of I/O modalities. Some preliminary work
has suggested its utility for table input and output in managing database update,
database retrieval, and a directly manipulable image of tabular data. Our pro-
totype module generates forms in the intensional logic; then the components
originally developed for the natural language processor provide the translation
mechanism to and from intensional logic and underlying systems that actually
store the data.

1.4.4 Summary
The challenge: To develop ways of easily interfacing NL systems to multiple
instances of various types of underlying application systems.

The new approach: Define functional representations of the capabilities of un-


derlying systems. Produce mappings to underlying systems based on this func-
24 M. Bates, R. J. Bobrow, and R. M. Weischedel

tionality. Represent the result of NL processing in this form. Use techniques from
expert systems to formulate a process to satisfy the user's request or command.

1.5 Partial understanding of fragments, novel language,


and errorful language
It is time to move away from dependence on the sentence as the fundamental unit
of language. Historically, input to NL systems has often had to consist of com-
plete, well-formed sentences. The systems would take those sentences one at a
time and process them. But language does not always naturally occur in precise
sentence-sized chunks. Multi-sentence input is the norm for many systems that
must deal with newspaper articles or similar chunks of text. Subsentence frag-
ments are often produced naturally in spoken language and may occur as the
output of some text processing. Even when a sentence is complete, it may not be
perfectly formed; errors of all kinds, and new words, occur with great frequency
in all applications.

1.5.1 Multi-sentence input


Historically, computational linguistics has been conducted under the assumption
that the input to a NL system is complete sentences (or, in the case of speech, full
utterances) and that the output should be a complete representation of the mean-
ing of the input. This means that NL systems have traditionally been unable to
deal well with unknown words, natural speech, language containing noise or
errors, very long sentences (say, over 100 words), and certain kinds of construc-
tions such as complex conjunctions.
One of the problems is that advocates of local processing have tended to ignore
syntactic and other constraints, while advocates of top down processing have
tended to ignore coherent fragments unless they fit properly in the overall
scheme.
The solution, we believe, is to move away from thinking that language comes
in sentences and that the goal of understanding is a complete representation of
meaning. We must move toward processing bits and pieces of language, whether
the input to our NL systems comes that way or not, and toward creating structures
that, like the fractals found in nature, have a kind of coherency that can be
viewed at many levels.
Some semantic distinctions have no selectional import (e.g., quantifiers, and
some adjuncts), while others have considerable selectional import.
One of the ideas whose time has passed is the notion of prepositional phrase
attachment. Although in many cases it is not harmful to think of a PP attaching to
a particular constituent, sometimes it is more useful to think of a single PP
attaching simultaneously at several different points (for example, "I kicked the
shell on the beach"), or relating two different constituents in a sentence (for
Critical challenges for NLP 25

example, "The average concentration of aluminum in breccias"). When fixed


constituent structure pinches too much, language should not be forced into it.
What is the right representation for the meaning of multi-sentence language?
The "right" representation for text may depend on the type of text and its
purpose. For example, commands may be represented very differently from
questions. It may also depend on the purpose of the user: for example, question
answering versus controlling a process versus storing information for later re-
trieval.
Currently, most systems that attempt to understand multi-sentence text create a
frame as output (or some other structure that is similar in function). Generally,
the names of the slots of the frame consist of the type of information and
relationships that were to be gleaned from the text, and the fillers describe the
entities that were found. Thus it is difficult to represent unexpected information.

1.5.2 Errorful language, including new words


Handling novel, incomplete, or errorful forms is still an area of research. In
current interactive systems, new words are often handled by simply asking the
user to define them. However, novel phrases or novel syntactic/semantic con-
structions are also an area of research. Simple errors, such as spelling or ty-
pographical errors resulting in a form not in the dictionary, are handled in the
state-of-the-art technology, but far more classes of errors require further research.
The state-of-the-art technology in message understanding systems is illus-
trative. It is impossible to build in all words and expressions ahead of time. As a
consequence, approaches that try for full understanding appear brittle when
encountering novel forms or errorful expressions.
The state of the art in spoken language understanding is similarly limited. New
words, novel language, incomplete utterances, and errorful expressions are not
generally handled. Including them poses a major roadblock, for they will de-
crease the constraint on the input set, increase the perplexity2 of the language
model, and therefore decrease reliability in speech recognition.
There is ample evidence that the ability to deal with novel, incomplete, or
errorful forms is fundamental to improving the performance users can expect
from NLP systems. Statistical studies for written database access (Eastman and
McLean, 1981; Thompson, 1980) show that novel, errorful, or incomplete lan-
guage comprises as much as 25-30% of type input; such phenomena (Fromkin,
1973) probably arise even more frequently in spoken language than in written
language. In addition, we believe that interpreting incomplete input is particu-
larly important for the following reasons:
1. Fragments occur frequently in military messages, such as Navy CAS-
REPs, Navy OPREPs, Army SITREPs, and Army Operations Orders.
2
Perplexity is a measure of the average number of words that may appear next at any point in the input.
26 M. Bates, R. J. Bobrow, and R. M. Weischedel

2. Incomplete input arises in spoken language not only because we speak


in fragments but also because acoustic processing at times can detect
only fragments with high confidence.
3. Fragments result when processing an incomplete, novel, or errorful
input, since a complete interpretation cannot be produced.

The problem
In current technology, almost all systems employ a search space of the possible
ways of combining the meanings of words into meaningful phrases and a mean-
ingful whole in context. In artificial intelligence terms, the search is a constraint
satisfaction problem: find one or more interpretations such that no applicable
constraint is violated. Formal models of grammar, semantics, and discourse state
constraints on language in an all-or-nothing fashion, as if we always spoke and
wrote in complete thoughts, saying exactly what we mean without vagueness,
inaccuracy, error, or novelty in expression.
In constraint satisfaction problems, if a search fails to find a solution where all
constraints are satisfied, many search alternatives will have been tried without
leading to ultimate success. The problem is to come up with a partial solution (in
the case of language processing, a partial interpretation), an explanation of why
no solution is found (e.g., why no interpretation can be found), or a way to relax
a constraint to produce with a complete solution (a complete interpretation).
Which of the partial solutions, if any, is the most likely path to lead to success if a
constraint is relaxed? Which partial path(s) in the search space is a good basis for
explaining why no solution can be found?
All previous work suffers from this problem mentioned above, unless the
application domain is very limited or the types of errorful/novel forms allowed
are very few. This is because too many alternatives for what was meant are
possible; an NLP system does not even have a foolproof way of knowing whether
the user's input is errorful or whether the input represents a novel form. How to
hypothesize the problem in an input and how to deal with it is understood for a
large class of possible problems, e.g., see Carbonell and Hayes (1983); Jensen et
al. (1983); Weischedel and Sondheimer (1983). What is not known is how to
rank the many alternative interpretations that arise, as illustrated in the example
above. The lack of a reliable scoring mechanism has been a technological road-
block.
Real language may be absolutely ill-formed (a native speaker would judge it to
be something to be edited, an error, not what was intended, or otherwise "bad"),
or relatively ill-formed (ill-formed with respect to a NL system's well-formed-
ness constraints, even though a native speaker may judge it well-formed).
The following kinds of problems were enumerated by Weischedel (1987);
others are readily available. Some examples of absolutely ill-formed language
that are peculiar to written language are:
Critical challenges for NLP 27

1. Typographical errors, e.g., oter, instead of other. Typos may also result
in recognizable words, such as an instead of and.
2. Spelling errors, e.g., Ralf instead of Ralph.
3. Punctuation errors, e.g., inserting or omitting commas incorrectly, mis-
placement or omission of apostrophes in possessives, etc.
4. Homonym errors, e.g., to instead of too, or confusing there, their, and
they're.
Similarly, there are classes of absolute ill-formedness peculiar to spoken lan-
guage.

5. Mispronunciations, e.g., saying that word as if it were spelled mispro-


nounciations, or stressing the wrong syllable. Fromkin (1973) has pro-
vided a taxonomy of human speech production errors that appear rule-
based, as opposed to ungoverned or random occurrences.
6. Spoonerisms, e.g., saying fauter waucet instead of water faucet.

Each of the classes above are human performance errors, resulting in absolute
ill-formedness. However, the overwhelming variety of ill-formedness problems
arise in both the spoken and written modality; examples of absolute ill-formed-
ness include:

1. Misreference, as in describing a purple object as the blue one.


2. Word order switching, as in saying the terminal of the screen when one
meant the screen of the terminal. (Fromkin [1973] has recorded these
errors.)
3. Negation errors, e.g., All doors will not open when the train conductor
meant Not all doors will open.
4. Omitting words, as in Send file printer rather than the full form Send the
file to the printer. (Although this may seem to occur only in typed
language, we have heard such omissions in spoken language. Further,
consider how many times, when struggling for the appropriate word,
you start the utterance over, or someone supplies an appropriate word
for you.)
5. Subject-verb disagreement, as in A particularly important and chal-
lenging collection of problems are relatively ill-formed and arise in
both spoken and written language or in One of the overwhelming
number of troubles that befell them are . . .
6. Resumptive pronouns and resumptive noun phrases, as in The people
that he told them about it, where them is intended to be coreferential
with people.
1. Run-together sentences, as if the person forgot how the sentence was
started. An example is: She couldn't expect to get a high standard
salary and plus being so young.
28 M. Bates, R. J. Bobrow, and R. M. Weischedel

8. Restarted sentences, as in Some people many try to improve society,


which was also collected in a written corpus.
9. Pronominal case errors, as in between you and I.
10. Word order errors, as non-native speakers can make, e.g., / wonder
where is the problem.
Some particularly important and challenging problems are relatively ill-
formed and arise in both spoken and written language.
1. Words unknown to the hearer or reader, but part of the language.
2. Novel or unknown word senses, although the word itself is known. For
instance, Navy jargon includes phrases such as What is Stark's readi-
ness? Although that sublanguage does not include preparedness as a
synonym for readiness, it would be useful for a system to be able to
infer what a user means by the input What is Stark's preparedness?
3. Novel (non-frozen) figures of speech, e.g., metaphor, metonymy, and
synecdoche.
4. Novel nominal compounds, as in window aisle seat, which was used by
a flight attendant on a wide-body jet.
5. Violated presuppositions, as in Did John fail to go? when John did not
try to go.
The above lists are not intended to be exhaustive. More thorough taxonomies
of ill-formedness exist. Statistical studies of frequency of occurrence for various
classes of ill-formedness have been conducted for written database access; those
studies suggest that as much as 25-30% of typed input may be absolutely or
relatively ill-formed.
From the definitions and examples, it is clear that
1. Ill-formed input need not be ungrammatical; there may be no interpreta-
tion due to semantic or pragmatic problems.
2. The NL system will probably not know whether the input contains an
error or whether its models are too limited to process the input.
3. Since there is no interpretation for the input, then one or more of the
constraints of the NL system are violated; understanding ill-formed
input therefore is a constraint satisfaction problem.
4. Since one or more of the constraints are violated, relaxing constraints in
order to find an interpretation will mean opening up the search space for
an interpretation substantially.

A suggestion
One new approach is to use probabilistic language models based on statistics
derived from a chosen corpus, and utilizing those statistics together with the
Critical challenges for NLP 29

knowledge bases acquired from the corpus. The probabilistic model will rank
partial interpretations for incomplete, errorful, or novel expressions. This will
enable ranking of alternative interpretations when the input is complete, in-
complete, or errorful.
The large annotated corpora described in the previous section will offer signifi-
cant data to estimate such probabilities. For instance, the frequency of occur-
rence of types of phrases (e.g., NP and PP in the earlier annotated example) and
statistics on relative frequency of grammar rules can be computed. Such statistics
can be used to find the most predictive statistical language models for NLP
systems.
The probabilistic language models in speech recognition are probably not
directly applicable. Typically probabilities of two- or three-word sequences are
computed from a corpus of utterances and are used in assigning weights to each
alternative rendering of the speech wave into sequences of words. The limitation
in those models is that only local information is used, whereas it is well known in
linguistics that there are long distance dependencies well beyond three-word
sequences.
Scoring techniques based on large annotated corpora may provide the missing
link for progress in understanding fragmentary language, in processing errorful
language, in determining what was meant in novel expressions, and in process-
ing incomplete forms.
In the last ten years, it has often been suggested that ignoring constraints, or
bottom-up parsing, or a semantics-first strategy might be used to deal with ill-
formed input, but in each case, although particular examples could be made to
work, the approach generated too many possibilities to be used in a truly general
way. However, there seems to be a clear distinction between those classes of
problems for which reasonably good syntactic and semantic strategies exist, and
classes of ill-formedness that seem particularly intractable without a strong
model of pragmatic knowledge for proper understanding. Examples of the latter
include asias errors (spelling/typographical errors that result in a known word),
run-together sentences, pragmatic overshoot, contextual ellipsis requiring con-
siderable reasoning to resolve, and inferring the meaning of unknown words.

1.5.3 Summary

The challenge. To develop appropriate representations of fragmented, extended,


errorful language, partially understood.

The new approach. Use local structure-finding processes that work primarily
bottom-up, inserting local information into a global framework (not a standard parse
tree or logical expression), and switching strategies to top-down when possible.
30 M. Bates, R. J. Bobrow, and R. M. Weischedel

1.6 Additional research opportunities


We suggest the following as areas of opportunity for near-term research to make
significant breakthroughs that will move NLP through the 1900s and beyond:

Acquisition of corpora, grammars, and lexicons. The development of useful


systems requires observation of the behavior of potential users of interactive
systems under realistic circumstances, and the collection of corpora of typical data
for text analysis and machine translation systems. Although we believe it is
unlikely that full grammars and lexicons can be induced completely automatically
in the near future, useful results may be obtained soon from induction and
acquisition techniques based on annotated corpora and machine-readable dictio-
naries. It is also likely that statistical measures useful for biasing algorithms can be
extracted from a handcrafted grammar and a corpus. Approaches that appear
promising are (1) the learning of grammatical structures where the input has
already been annotated by part of speech and/or phrase structure, and (2) the
learning of lexical syntax/semantics from examples and/or queries to the user
given some pre-coded domain knowledge.

Increasing expressive power of semantic representation languages. Moving


beyond database query systems will require increasing the expressive power of
the languages used to express meaning, to include at least modal and higher-
order constructs. Reasoning tools for modal logics and for second-order logics
already exist, but appear intractable for language processing tasks. Approaches
that seem promising include encoding modal constructs in first-order logic,
hybrid approaches to representation and reasoning, and approaches to resource-
limited and/or shallow reasoning, such as adding weights to formulae and sub-
formulae.

Reasoning about plans. Recent work on plan recognition - the inference of the
beliefs and intentions of agents in context - has provided formal definitions of the
problem and some new algorithms. These have not yet been used as part of a
discourse component to help resolve reference, quantification, and modification
ambiguities or to formulate an appropriate response. The interaction between
plans, discourse structure, and focus of attention must also be investigated.
Promising approaches include incorporation of beliefs of the discourse partici-
pants, integrating existing models into discourse processing under simplifying
conditions, and exploring prosodic/linguistic cues to dialogue.

Combination of partial information. The standard control structure by which


various sources of information are combined in language interpretation seems to
limit what NL systems can do. Several proposals for more flexible control
structures have been made recently, each covering a subset of the knowledge
sources available. More comprehensive schemes need to be developed. Two
Critical challenges for NLP 31

promising approaches are generalization of unification to NL architectures, and


use of global, weighted control strategies, such as in evidential reasoning.

Improving robustness. Published studies suggest that as much as 25-30% of


typed input contains errors, is incomplete, uses novel language, or otherwise
involves challenging phenomena that are not well handled theoretically. The
frequency of occurrence for these classes is even higher in spoken language than in
written language. The text of some messages, such as Navy RAINFORM and
CASREP messages and bank telexes, is highly telegraphic. It should be possible to
develop a domain-independent theory that allows at least partial understanding of
some of these novel and errorful uses, and test it in narrowly defined domains.
Promising approaches are to employ unification strategies, plan recognition,
and/or weighted control strategies to determine the most likely interpretation and
the most appropriate response/action.

Relating interpretation and action. The problem of how to relate interpretations


expressed in a meaning representation language and calls to application systems
(databases, summarizing algorithms, etc.) has not been fully resolved, nor in fact
precisely stated. This is crucial to the systematic separation of the natural lan-
guage part of the system from the application part. Any approach should deal
with applications beyond databases (beyond the semantics of tables) and should
avoid the challenges of automatic programming.

Finding the relationship between prosody, syntactic ambiguityy and discourse


structure. Syntactic and discourse boundaries are one of the main sources of
interpretation ambiguity. Recently discovered evidence shows that prosodic in-
formation is a good indicator of these boundaries. Automatic extraction of pro-
sodic information would revolutionize the interpretation of spoken language.
Further, generation systems could add prosodic information to signal syntactic
structure and discourse structure.

Measuring progress. The means of measuring progress is still an active area of


discussion among NL scientists, as evidenced by workshops on Natural Language
Evaluation held in December 1988 and June 1991 (Neal and Walter, 1991).
Measures of correctness can be relatively simply stated for database query sys-
tems without dialogue capabilities (e.g., without sequence-related queries or
clarifications), or for text analysis systems for database entry. They are much
more difficult to state when stylistic matters need to be considered (as in machine
translation systems) or when system responses affect subsequent user utterances.
They probably cannot be usefully stated in a domain- or task-independent way.
Measures of task difficulty, or of ambiguity of the language model, analogous to
speech recognition's perplexity, are much more difficult to state. The recent
DARPA program in spoken language understanding is developing formalisms for
evaluating spoken language systems (Boisen et al., 1989; Bates et al., 1991).
32 M. Bates, R. J. Bobrow, and R. M. Weischedel

Measurement of NL systems requires three distinct types of comparisons:

1. Longitudinal: It is critical to be able to measure the performance of a


system over time, so that progress can be tracked.
2. Cross-System: It should be possible to compare the overall performance
of two systems in explicit terms. This focus on whole-system perfor-
mance will help localize the strengths and weaknesses of complete
systems and will identify topics for research and development efforts.
3. Component: It should be possible to evaluate and compare parts of
systems and evaluate coverage of unknown phenomena. This focus on
components will help point out areas of relative strength in different
systems and will provide priorities and goals for specific research.
Both the longitudinal and cross-system measures should include not merely
the percentage of inputs banded correctly but also estimates of productivity
improvements for the end user.

1.7 Conclusion
The list of hard, interesting problems on which to make progress in computation-
al linguistics could go on and on. However, we feel that knowledge acquisition,
interaction with multiple underlying systems, and techniques for partial under-
standing are the three solvable problems that will have the most impact on the
utility of natural language processing. We encourage students to embark on these
rewarding research areas, and look forward with eagerness to see what advances
the next decade will bring.

References
Ayuso, D. (1985). The Logical Interpretation of Noun Compounds. Master's thesis,
Massachusetts Institute of Technology.
Ayuso, D. M., Shaked, V., and Weischedel, R. M. (1987). "An Environment for Acquir-
ing Semantic Information." In Proceedings of the 25th Annual Meeting of the Asso-
ciation for Computational Linguistics, pp. 32-40. ACL.
Bates, M. (1989). "Rapid Porting of the Parlance Natural Language Interface." In Pro-
ceedings of the Speech and Natural Language Workshop, pp. 83-88. Morgan Kauf-
mann Publishers Inc., San Mateo, CA.
Bates, M., Bobrow, R., Boisen, S., Ingria, R., and Stallard, D. (1991). "BBN ATIS
System Progress Report - June 1990," DARPA Speech and Natural Language Work-
shop, Hidden Valley, PA, Morgan Kaufmann Publishers, pp. 125-126.
Bates, M., Boisen, S., and Makhoul, J. (1991). "Developing an Evaluation Methodology
for Spoken Language Systems," DARPA Speech and Natural Language Workshop,
Hidden Valley, PA, Morgan Kaufmann Publishers, pp. 102-108.
Bobrow, R., Ingria, R., and Stallard, D. (1991). "Syntactic and Semantic Knowledge in
the DELPHI Unification Grammar," DARPA Speech and Natural Language Work-
shop, Hidden Valley, PA, Morgan Kaufmann Publishers, pp. 230-236.
Bobrow, R., and Ramshaw, L. (1991). "On Deftly Introducing Procedural Elements into
Other documents randomly have
different content
Samstags-Advertiser nach der Rheinprovinz befördern, überhaupt
Notizen über die Polizeiverbrechen unter die Bourgeois schleudern.
Nun folgende Vorschläge:
1. Bei dem höchst zweideutigen und stellenweise von uns jetzt zu
erweisenden unzweideutigen Charakter der einzigen gravierenden
Zeugnisse ist Dein Zeugnis und das von Lupus, Pieper usw., wenn es
eidlich abgelegt und beglaubigt wird, sehr wichtig. Das öffentliche
Ministerium mag sagen, was es will, das schadet nichts – die
Geschworenen halten uns und die Angeklagten doch für Gentlemen.
Nun ist aber nichts einfacher, als daß zwei oder drei von Euch sich
zum Windham begeben und dort diejenigen auf London Bezug
habenden Sachen beschwören, die Ihr alle wißt. Also zum Beispiel
a. daß gar kein H. Liebknecht existiert, sondern nur ein W.
Liebknecht, soweit Ihr wißt, und Ihr nie einen H. Liebknecht gekannt
habt;
b. daß die Frau Daniels Dir nie geschrieben;
c. daß Ihr außer den Mittwochzusammenkünften nicht auch etwa
in einem anderen Lokal an einem Donnerstag andere
Zusammenkünfte gehabt und
d. daß Ihr die in den Protokollen von Hirsch enthaltenen Aussagen
von Reden, Vorträgen usw., die Ihr gehalten haben sollt, für utterly
untrue[1] erklärt;
e. daß der Zettel, der bei dem roten Katechismus beigelegen, und
den das öffentliche Ministerium als in Deiner Handschrift abgefaßt
ansieht, nicht von Dir herrührt – und was sonst noch aus den letzten
Verhandlungen und ersten Aussagen Stiebers als unwahr und der
Widerlegung wert erscheint.
Dies alles, vor Windham beschworen, wird dieser als gewöhnliches
Affidavit ausfertigen – Ihr könnt’s gleich englisch im Konzept
mitbringen – und Ihr bittet ihn, es einem Policeman zu geben, der
mit Euch zum preußischen Konsul Hebeler in die City geht, dieser
muß die Unterschrift von Windham legalisieren, sonst verliert er sein
Exequatur. Dies in zwei Kopien so ausgefertigt, kann dann nach Köln
gehen und wird seinen Effekt nicht verfehlen. Ich halte dies für
höchst wichtig, da damit alle legalen Formen befolgt sind und das
Ding ein gerichtlicher Akt ist. Sollte Hebeler trotzdem die Unterschrift
weigern, so geht Ihr zum ersten besten Notary public, der
legalisieren wird (letzteres ist ein Weg, der in einem ähnlichen Falle
meinem Alten von der Behörde in Preußen angegeben worden).
2. Einige Leute aus dem Stechanschen Arbeiterverein,
Komiteemitglieder usw., könnten ebenfalls, nicht mit kleinen
Zettelchen, sondern mit ganzen Seiten oder möglichst großen
Stücken der Hirschschen Handschrift vor den Magistrat gehen und
beschwören, daß dies die Handschrift des Hirsch ist. Cela vaut
infiniment mieux[2] als bloße unbeglaubigte Ausschnitte.
Wir werden Euch Montag wieder einiges Geld zugehen lassen,
damit Ihr deswegen nicht in Verlegenheit kommt. Dein eidliches
Zeugnis könnte erst ganz zuletzt abgehen – das hat seine guten
Seiten; nur muß man sorgen, daß alles hinkommt, ehe die
Zeugenverhöre geschlossen sind.
Vergiß nicht, mir sobald wie möglich einige sichere Adressen
zukommen zu lassen.
Die Aussage von Stechan wegen der Fälschung muß ebenfalls vor
einem Magistrat beschworen werden. Cela pourra avoir de brillants
résultats.[3] – –
Str[ohn] ist wieder in Bradford, etwas krank, und kommt Mittwoch
oder Donnerstag her. Ich schreibe ihm heute und instruiere ihn so
weit, daß Du, wenn Du ihm Sachen schickst, auf geschickte, nicht
mit meinen Wegen kollidierende Besorgung rechnen kannst. Die
Hauptsache ist, daß alle kaufmännischen Adressen jede nur einmal
benutzt wird.
Wir müssen es dahin bringen, daß man künftig nicht mehr von
Diebereien, sondern von Stiebereien spricht.
Da ist ja auch der Advokatanwalt Schürmann unter den
Verteidigern. Auch dessen Adresse kann für Einlagen benutzt
werden. Schneider ist wirklich zu gefährlich. – –
Werden die Kölner, was ich aber für fast unmöglich halte, wenn
wir fortfahren, alle Mittel aufzubieten, um alle Informationen und
Aktenstücke herüberzubefördern, doch verdonnert, so müssen wir
unbedingt etwas schreiben. Wo nicht, glaube ich, würde es den
Effekt der Regierungsniederlage nur abschwächen. Indes kommt’s
auch dann noch darauf an. Vor allen Dingen muß von allen
Aktenstücken, Affidavits usw. genaue Kopie behalten werden, mit
allen Legalisationen usw., denn diese Dinge machen dann eine Reihe
pièces justificatives.[4]
Dronke hat mich um 10 Schilling gebeten, da er krank und im
Pech ist. Wenn das nächste Geld ankommt, also Dienstag, gib sie
ihm oder etwas mehr.
Die Adressen schickst Du mir am besten per Pickford oder Carver.
Grüße alle und schreibe bald
Deinem F. E.

Wir führen hier genau Register über alle abgehenden Dokumente,


Datum, Beförderungsweg usw.

[1] Gänzlich unwahr.

[2] Das ist viel mehr wert.

[3] Das kann glänzende Wirkungen haben.

[4] Beweisstücke.

198
Lieber Marx! Manchester, 18. Oktober 1852.
Hierbei der Rest des neulichen Artikels. Gestern auch den folgenden
erhalten. Das heute gesandte Stück kannst Du gleich via Liverpool
per United States Mail Steamer abschicken, am Mittwoch morgen
segelt der Pacific. Am Freitag wirst Du wieder etwas erhalten.
Mache doch die Artikel nicht mehr so lang. Mehr als eine bis
anderthalb Spalten kann Dana gar nicht wünschen, es wird zu viel
für eine Nummer. Diesen neuen Artikel werde ich wieder spalten
müssen, doch geht es sehr schwer, und ich weiß noch nicht wo. Fünf
bis sieben Seiten von der Handschrift Deiner Frau sind vollkommen
genug, und gibst Du mehr in einem Artikel, so wird Dana Dir nicht
einmal dafür dankbar sein.
Bürgers, Röser und vielleicht Otto, sowie Nothjung scheinen mir so
ziemlich geliefert. Gegen Daniels, Becker, Jacobi scheint gar nichts
vorzuliegen, und so hoffe ich, daß diese wenigstens freikommen.
Becker hat sich mit großer Unverschämtheit herausgearbeitet. Je
mehr diese aber diskulpiert[1] werden, mit desto größerem Eifer,
glaube ich, wird sich Gerichtshof und Jury auf die Kompromittierten
werfen, die beleidigte Bourgeoisie und der beleidigte Staat wollen
ihre Opfer haben.
An den Siegeln aller Briefe, die ich von Dir erhalte, ist mit heißem
Eisen herumgearbeitet, doch, soweit ich beurteilen kann, pour le roi
de prusse.[2] Das an der Enveloppe sitzende Gummi verhindert das
Eindringen.
Weerth ist hier, hat mir das Paket gebracht und läßt Euch alle
grüßen. Das Szemeresche Manuskript über Kossuth ist weit besser
als das über Görgey – dem Kossuth ist er gewachsen. Die
Pieperschen Übersetzungen habe ich noch nicht ansehen können,
ich bin zu sehr auf dem Kontor beschäftigt und abends manchmal
matt wie ein Hund.
Beste Grüße an Deine Frau.
Dein F. E.

[1] Entlastet.

[2] Für den König von Preußen, umsonst.

199
Lieber Marx! [Wahrscheinlich 22. Oktober 1852.]
Wenn Du in Zukunft präzis auf Zusendung der Artikel für Dana
rechnen willst, so mußt Du Dich hüten, mir gerade auf den speziellen
Donnerstag Abend ... zuzuschicken.
Wir sind also jetzt von Staats und sogar Polizei wegen als
„intelligente“ Leute anerkannt, teste[1] Stieber. Eine schöne
Geschichte. Wie der dumme Stieber die Kerls für seinen eigenen
Mouchard Cherval verantwortlich zu machen sucht. Weißt Du etwas
über die Gründe der Verhaftung von Kothes und Bermbach? Gerade
diese beiden – das ist ominös. Den Haupt werden wir aber
züchtigen. Weerth wird erfahren, wo er in Südamerika ist, und wenn
er hinkommt, ihn demaskieren. Dazu ist es nötig, daß man sich die
Kölnische Zeitung oder ein anderes Blatt verschafft, worin seine
Aussagen stehen. Könnt Ihr das nicht besorgen? Bietet alles auf; es
wäre zu schön, den Schuft die Macht der Neuen Rheinischen Zeitung
bis nach Brasilien fühlen zu lassen.
Dieser Tage mehr, sowie auch Übersetzungen.
Dein F. E.

[1] Bezeugt von.

200
Lieber Engels! 28 Deanstreet, Soho, 25. Oktober 1852.
Wegen unserer Korrespondenz müssen wir andere Maßregeln
treffen. Es ist positiv, daß wir einen Mitleser im Ministerium Derby
haben. Zudem stellt sich, wenigstens versuchsweise, wieder eine
Schutzwache (abends) vor mein Haus. Ich kann Dir also absolut
nichts schreiben, wovon ich nicht ratsam halte, daß es die
preußische Regierung in diesem Augenblick erfährt.
Dana benimmt sich sehr kommun gegen mich. Ich habe ihm vor
ungefähr sechs Wochen geschrieben und ihm genau gesagt, wie es
bei mir steht, und daß ich das Geld für die abgesandten Artikel
umgehend haben muß. Er hat die Artikel regelmäßig abgedruckt,
aber das Geld noch nicht geschickt. Ich muß natürlich
demungeachtet exakt fortfahren. Sonst bin ich doch am Ende wieder
der Bestrafte.
Nun hatte ich schon vor fünf Wochen den Landlord mit dieser
Aussicht auf Amerika beschwichtigt. Heute kommt der Kerl her und
machte der housekeeperin[1] und mir einen scheußlichen Skandal.
Er zog sich heute – da ich zuletzt zur ultima ratio, nämlich zur
Grobheit meine Zuflucht nahm – mit der Drohung zurück, wenn ich
ihm diese Woche nicht Geld schaffe, werde er mich auf die Straße
werfen, vorher aber noch einen broker[2] mir in das Zimmer setzen.
Von Cluß sind vor vier bis fünf Tagen 130 Exemplare des Brumaire
angekommen. Ich konnte sie aber nicht von der Douane nehmen bis
jetzt, da ich 10 Schilling 9 Pence bei dieser Gelegenheit entrichten
muß.
Kothes und Bermbach sind verhaftet worden, weil ich letzterem
durch ersteren eine zur Verteidigung nötige Arbeit, die etwas
voluminös war (trotz dünnem Papier und kleiner Perlschrift),
zugeschickt hatte. Die Regierung glaubte einen famosen Fang getan
zu haben. Aber jeune[3] Sädt, bei näherer Ansicht, beschwor sicher
Himmel und Hölle, um die Sache niederzuschlagen, denn das
Aktenstück enthielt sonderbare strictures[4] über das Talent usw.
des jungen Sädt und konnte, den Juries mitgeteilt, nur zur
Freisprechung der accusés[5] beitragen.
In der „Neuen Preußischen Zeitung“ ist „G. Weerth“ als Mitglied
der Zentralbehörde in Köln angeführt, und zwar wird dies zitiert aus
dem Anklageakt.
Dein K. M.

Sobald der Prozeß vorüber ist, er mag nun ausfallen, wie er will,
müssen wir beide einen oder zwei Druckbogen „An das Publikum zur
Aufklärung“ drucken lassen. Ein günstigerer Moment, zur Nation en
large[6] zu sprechen, kommt nicht wieder. Zudem dürfen wir den
Schein des Ridicule nicht dulden, den selbst die moralische Würde
und szientifische Tiefe des sanften Heinrich unfähig sind zu
zerstreuen.
Cherval hat selbst an den Londoner Deutschen Arbeiterverein
geschrieben, er sei „Spion, aber im edlen Sinne des Cooperschen
Spions“. Ich habe auf sicherem Wege einem der Advokaten die
nötigen Aufklärungen zukommen lassen.
Wegen der oben angeregten Publikation über den „Kölner Prozeß“
muß sich jetzt schon umgesehen werden. Mir schiene das beste,
wenn Du an Campe schriebst, er solle Dir einen soliden
Kommissionär nennen, im Falle er selbst zu ängstlich sei. Da Du ein
zahlungsfähiger Mann bist, kann dem Kommissionär gesagt werden,
er erhalte das Geld zum Beispiel in drei Monaten (auf Wechsel),
wenn er in der Zwischenzeit sich nicht (was sicher) schon aus dem
Verkauf bezahlt gemacht. Übrigens können die Druckkosten für eine
solche Lumperei höchstens auf 25 Taler kommen.
Vale! und überlege die Sache. Schweigen können wir nicht, und
wenn wir nicht zur Zeit für die Druckgelegenheit sorgen, kommen
wir wieder nicht im rechten Augenblick.

[1] Vizewirtin [die das Haus für den Eigentümer – „Landlord“ – zu verwalten
hat].

[2] Auspfänder.

[3] Jung.

[4] Kritische Sätze.

[5] Angeklagten.

[6] Im weiten Sinne.

201
Lieber Marx! Manchester, 27. Oktober 1852.
Ich hatte, als ich gestern schrieb, die Stiebersche Aussage nur sehr
flüchtig gelesen, und daher war ich heute sehr heiter überrascht, als
Dein Aktenstück der Sache eine Wendung gab, die mich jetzt nicht
mehr an der Freisprechung aller Angeklagten verzweifeln läßt. En
effet,[1] die Blamage des Stieber ist komplett. Die Sache ist hier
nochmals von mir abgeschrieben und auf zwei verschiedenen, sehr
guten Wegen nach Köln abgegangen; auch habe ich, was schon in
London hätte geschehen sollen, die zwei Zettel mit Hirschs
Handschrift an das Original angesiegelt und dabei diesen Umstand
mit meiner Unterschrift dokumentiert, so daß sie im schlimmsten
Falle nicht ohne Unterschlagung des Ganzen unterschlagen werden
können. Ich habe nun noch einige Wege zur Verbindung mit Köln
entdeckt, und obwohl diese ersten beiden (die aber nicht wiederholt
werden können) eine Wahrscheinlichkeit von 99 Prozent bieten, daß
die Sachen richtig und denselben Tag bei Schneider eintreffen, so
wäre es doch gut, wenn ich noch ein drittes, von Dir beglaubigtes
Exemplar mit neuen Hirschschen Handschriftproben erhielte, um dies
noch auf anderem Wege hinzubefördern. Übrigens können die
Pr[eußen] dies Ding nicht unterschlagen, das hätte Kriminalfolgen
für die Beteiligten.
Dein Brief heute an mich war erbrochen, da die vier Zipfel der
Enveloppe nicht alle vom Siegel gut gefaßt waren. Ob der an
St[rohn] auch, ist schwer zu sagen, da die Firma das äußere Kuvert
erbrochen. Doch war dies Aufbrechen so leicht vor sich gegangen,
daß ich fast schließen muß, auch hier sei man schon früher dran
gewesen. Also taugt auch die Steinthal-Adresse nichts mehr.
Schreibe an unseren alten James Belfield, Golden Lion, Deansgate,
Manchester, inwendig Kuvert „F. E.“, weiter nichts. Bei sehr wichtigen
und gefährlichen Sachen mache es wie ich jetzt: ein Paket beliebigen
Inhalts, worin Dein Brief liegt, per Pickford & Co. an mein Haus, und
abwechselnd per Chaplin, Horne & Carver an mich, Adresse Ermen &
Engels unfrankiert. Das ist ganz sicher. Laß aber die Adressen
namentlich per Post abwechselnd mit verschiedenen Handschriften
schreiben und laß die Pakete per Spediteur nicht immer durch
denselben und von demselben Orte ins Office tragen. Dann ist
letzterer Weg ganz sicher. Gib mir dann entweder eine sichere
Adresse nach London auf diesem Wege an oder laß irgend jemand,
dessen Hauswirt nicht argwöhnisch, einen falschen Namen
annehmen à la Williams, oder sage mir, ob Lupus noch 4
Broadstreet, Dr[onke] noch im Model Lodging House und wo sonst
unsere zuverlässigen Leute wohnen, damit ich die Adresse wechseln
kann.
Alle diese Mittel abwechselnd in Tätigkeit gesetzt, werden uns
genügende Sicherheit verschaffen. Dazu schreibe, damit’s nicht
auffällt, gleichgültige Briefe per Post direkt, wie ich auch tun werde.
Das Kopieren des Aktenstücks hat mich so in Anspruch
genommen, daß ich wirklich nicht weiß, ob ich wegen Dana und
Freitagsteamer mein Wort in vollem Sinne halten kann. Etwas
kommt jedenfalls. Bedenke, daß mir an gewisser Stelle die schönsten
Knospen treiben und mich stellenweise am Sitzen verhindern; il faut
que cela finisse.[2]
Die Erklärung des alten Justizrats Müller wird dem Stieber schon
den Hintern mit Grundeis gehen machen wegen seiner
Originalprotokolle. Aus ihr geht auch hervor, daß die Juristen dort
überhaupt sehr wütend sein müssen wegen der Polizeiinfamien, die
der Stieber mit ganz altpreußischer Unkenntnis des rheinischen
Gesetzes, Gerichtsverfahrens und der rheinischen öffentlichen
Meinung so unverschämt, und wie ein Kind über seine Pfiffigkeit sich
freuend, an die große Glocke hängt. C’est de bon augure.[3]
Es ist schön: die Polizei stiehlt, fälscht, erbricht Pulte, schwört
falsche Eide, zeugt falsch, und zu allem dem behauptet sie das
Privilegium zu haben gegenüber den Kommunisten, die hors la
société[4] stehen! Dies und die Manier, wie die Polizei, in ihrer
schuftigsten Gestalt, alle Funktionen des öffentlichen Ministeriums
übernimmt, den Sädt in den Hintergrund drängt, unbeglaubigte
Zettel, bloße Gerüchte, Rapporte, Hörensagen als wirkliche
gerichtlich erwiesene Sachen, als Beweise vorbringt – c’est trop fort!
[5] Das muß doch wirken.
Dein F. E.

[1] In der Tat.

[2] Das muß ein Ende nehmen.

[3] Das ist ein gutes Anzeichen.

[4] Außerhalb der Gesellschaft.

[5] Das ist zu stark.

202
Lieber Engels! 28 Deanstreet, London, 27. Oktober
1852.
Ich hatte Dir geschrieben, daß ich ein „Lithographiertes Zirkular“
über den Kölner Prozeß abfassen würde. Aus dem Lithographischen
Zirkular ist jetzt ein Pamphlet von ungefähr drei Druckbogen
geworden. Die Sache jetzt noch zu lithographieren, geht aus
doppelten Gründen nicht: Erstens kommt eine so umfassende
Lithographie sehr teuer zu stehen, während sie nichts einbringt,
denn anstandshalber kann man solche lithographischen
Rundschreiben nicht verkaufen. Zweitens liest kein Mensch, und es
ist auch nicht zu verlangen, eine Lithographie, die den Inhalt von
drei Druckbogen bringt.
Es bleibt also nichts übrig, als die Sache drucken zu lassen. In
Deutschland impossible.[1] London ist der einzig mögliche Ort. Es
wird auch möglich sein, Kredit zu erhalten, wenn ich nur im
Bestande bin, einen Teil vorauszuzahlen. Ich ersuche Dich, hierüber
mit Weerth und Strohn zu konsultieren. Es ist aber kein Tag zu
verlieren. Wenn die Sache nicht jetzt kommt, hat sie kein Interesse
mehr. Meine Broschüre ist keine Prinzipienrettung, sondern auf
Darstellung der Tatsachen und des Verlaufs gegründete
Brandmarkung der Regierung. Ich selbst bin natürlich incapable,[2]
auch nur einen Centime für die Sache beizutreiben. Ich habe gestern
den von Liverpool her datierenden Rock versetzt, um Schreibpapier
zu kaufen.
Das Empire marschiert famos. Bonaparte versteht es wie kein
anderer darauf hinzuarbeiten, daß diesmal die Handelskrise
Frankreich noch grausamer trifft als England.
Dein K. M.

[1] Unmöglich.

[2] Außerstande.

203
[Marx an Engels ohne28 Deanstreet, 28. Oktober 1852.
Anrede.]
Das Geld erhalten und heute das Paket mit dem Brief. In meinem
letzten Schreiben an Dich und Weerth hatte ich absichtlich nichts
erzählt, was im Falle des Erbrechens der Briefe die preußische
Regierung weiter aufklären könnte über die gegen sie ergriffenen
Schritte. Heute berichte ich im Detail. Ich denke, wir haben eine
Kontermine gelegt, die den ganzen Regierungshumbug in die Luft
sprengt. Die Herren Preußen sollen sehen, qu’ils ont à faire à plus
fort.[1]
Montag erhielt Schneider II über Düsseldorf (an einen Kaufmann,
Freiligraths Bekannten, adressiert) einen Brief von mir, dessen Inhalt
in kurzem folgender: 1. 1847, während ich in Brüssel war, wurde
Cherval zu London durch Herrn Schapper und auf Vorschlag
Schappers in den Bund aufgenommen, also nicht 1848 von mir zu
Köln. 2. Von Ende Frühling 1848 bis Sommer 1850 wohnte Cherval
fortwährend zu London, wie durch seine housekeepers[2] bewiesen
werden kann. Er hauste also nicht während dieser Zeit als
Propagandist in Paris. 3. Erst [im] Sommer 1850 begab er sich nach
Paris. Die bei ihm abgefangenen Papiere und seine Aussagen vor
den Pariser Assisen beweisen, daß er Schapper-Willichs Agent war
und unser Feind. Daß Cherval Polizeispion, wird durch folgendes
bewiesen: 1. Wunderbare Flucht (nebst Gipperich) gleich nach der
Verurteilung aus dem Pariser Gefängnis. 2. Ungestörter Aufenthalt in
London, obgleich gemeiner Verbrecher. 3. Herr von Remusat (ich
habe Schneider ermächtigt, ihn im Notfall zu nennen) erzählte mir,
Cherval habe sich ihm als Agenten für den Prinzen von Orleans
angeboten. Er habe darauf nach Paris geschrieben und folgende (mir
in der Kopie vorgezeigte) Dokumente erhalten (für einige Stunden
zur Kopie), woraus folgt, daß Cherval erst preußischer Polizeiagent
war, jetzt bonapartistischer ist. Die preußische Polizei schlägt ihm
eine Geldsendung ab, weil das „double emploi“[3] sei und er von
französischer Seite bezahlt worden. – Endlich habe ich Schneider
einige einfache theoretische Auseinandersetzungen gemacht,
wodurch er die Schapper-Willichschen Dokumente von den
unserigen unterscheiden und die Differenz nachweisen kann.
Nebst dem Brief an Schneider II, den Du besorgt, ging dasselbe
Aktenstück über Frankfurt a. M. (wo der alte Ebner ihn auf die Post
legt und Quittung nimmt) an Advokat von Hontheim ab, und zwar
Dienstag. Dasselbe Paket enthält: 1. einen Brief von Becker an mich
mit Poststempel London und Köln versehen, woraus folgt, daß unser
Verkehr vor allem buchhändlerischer Natur war; 2. zwei Einlagen von
Daniels an mich in dem Beckerschen Briefe, worin er bloß von
seinem Manuskript spricht; 3. zwei Ausschnitte aus den Protokollen
von Hirsch; 4. einen Ausschnitt aus den Peoples Paper, worin Cherval
glücklicherweise selbst seine Residenz anzeigt; 5. auf Seite 3 dieses
Briefes befindlichen Brief (eigene Handschrift) des Herrn Stieber an
mich, während der „Neuen Rheinischen Zeitung“.
Dienstag abend kam durch Gelegenheit ein Brief von Schneider II,
woraus hervorgeht, daß sein erster durch die Post gesandter
unterschlagen ist. Dagegen hatte er einen von hier registrierten Brief
erhalten, den ich ihm durch Dronke schreiben ließ, worin ihm
angezeigt worden, daß Henze hier 6 bis 8 Wochen bei Willich war,
daß Willich von ihm unterhalten worden ist, daß Willich selbst hier
damit renommiert hat, er habe dem Henze Instruktionen gegeben,
wie er gegen uns aufzutreten. Schneider schreibt, daß sämtliche
Advokaten von der Unechtheit der Dokumente überzeugt, bittet
dringend, ihm Beweise, namentlich auch, daß Frau Daniels nie an
mich geschrieben.
Mittwoch hätte aus Geldmangel nichts geschehen können, wären
nicht glücklicherweise Deine 2 Pfund eingesprungen. Ich habe also
vor dem Police Court, Marlboroughstreet (before Mr. Wingham,
magistrate of the Metropolitan District,[4] der sich die Sache
erzählen ließ und sich furieusement[5] für uns und gegen die
preußische Regierung erklärte) zweierlei authentifizieren lassen:
1. Handschrift von Rings und Liebknecht, die, wie Schneider II
schreibt, fast alle Protokolle des Hirsch unterzeichnet haben. Du
weißt, daß Rings kaum schreiben kann, also famos von Hirsch zum
Protokollführer bestimmt ist.
2. Habe ich von dem Wirt unseres Zusammenkunftslokals
bezeugen lassen, daß seit März die „Society of Dr. Marx“[6] (der Kerl
kennt nur mich), ungefähr 16 bis 18 Mann, regelmäßig und nur
einmal die Woche, nämlich am Mittwoch, zusammenkommt, und daß
er und sein waiter[7] uns nie eine Zeile haben schreiben sehen. Den
Mist wegen des Mittwochs hat auch einer seiner Nachbarn, ein
deutscher Bäckermeister und Hausbesitzer bezeugt. Beide
Aktenstücke mit dem Siegel des Police Court sind im Duplikat
abgefaßt. Das erste Exemplar desselben schickte ich via [unlesbar]
an G. Jung, der mir glücklicherweise vor drei Tagen geschrieben, er
wohne in Frankfurt a. M. und Adresse gegeben. Jung wird selbst
nach Köln die Sachen bringen oder ein Exemplar hinschicken. Der
Brief, den er erhalten, ist an Schneider II gerichtet und enthält außer
den angegebenen polizeilich-gerichtlich beglaubigten Dokumenten:
a. Eine Kopie des ersten Briefes an Schneider nebst zwei
abermaligen Ausschnitten aus Hirschs Protokollen. b. Ausschnitt aus
einem Briefe von Becker an mich, wo glücklicherweise auf der
Rückseite Londoner und Kölner Poststempel. Becker schreibt wörtlich
wie folgt (weiter enthält das von mir hingesandte Stück nichts): „Der
Willich schickt mir die lustigsten Briefe ....“ c. Drei Briefe von
Bermbach an mich, woraus die Natur unseres Briefwechsels
hervorgeht, und wovon der eine (vom März) zugleich die Antwort
enthält auf mein Schreiben von wegen des Hirsch und der
Denunziation der Frau Daniels und der bei ihr erfolgten
Haussuchung. Dieser Brief beweist, daß sie nicht mit mir in
Korrespondenz stand. d. Abschrift des Briefes von Stieber. e.
Instruktion an Schneider, worin ich ihm unter anderem auch mitteile,
daß die beglaubigten Dokumente oder Duplikat Donnerstag, 28.
Oktober, in einem registrierten Brief von London an ihn direkt unter
seiner Adresse abgehen werden und gleichzeitig er über Düsseldorf
von Kaufmann W. den Registrationsschein erhalten wird.
Unterschlägt die Regierung also diesmal, so ertappen wir sie
nachweislich au flagrant délit,[8] ohne daß es ihr gelingt, der
Verteidigung etwas anderes zu entziehen als ein Duplikat.
Im Advertiser von künftigem Sonnabend (30. Oktober) wirst Du
eine kurze Erklärung über die infamen Artikel der Times und Daily
News finden. Sie ist gezeichnet: „F. Engels, F. Freiligrath, K. Marx, W.
Wolff.“ Dasselbe in mehreren Wochenblättern.
Ich denke, die preußische Regierung wird diesmal in einer Weise
blamiert werden, wie es selbst ihr noch nicht vorgekommen ist, und
sich überzeugen, daß sie nicht mit den Tölpeln von Demokraten zu
tun hat. Sie hat die Leute gerettet durch die Dazwischenkunft des
Stieber. Selbst die Verhaftung des Bermbach ist ein Glück. Ohne dies
konnten seine Briefe nicht hinübergesandt werden. Er hätte sich
dagegen gesträubt, um nicht provisorisch gesetzt zu werden. Jetzt,
wo er sitzt, ist alles all right. –
Besten Gruß an Weerth.
Dein K. M.

Über sichere ... Adressen hierhin das nächste Mal.


[Auf einer neuen Seite folgt die Abschrift des Briefes von Stieber aus den
„Enthüllungen“, S. 46/47, und daran anschließend fährt Marx fort:]
Ich ersuche Dich nun, auf dem dritten, in Deinem Briefe
angedeuteten Wege nach Köln folgende Zeilen an Schneider zu
schreiben und sie ihm umgehend zukommen zu lassen.
„Stieber hat allerdings die 14 bis 16 der Willich-Schapperschen
Clique zugehörigen Dokumente gekauft, aber er hat sie zugleich
gestohlen. Er hat nämlich einen gewissen Reuter für bares Geld zum
Diebstahl sollizitiert. Reuter war seit lange nicht gerade
„Polizeibeamter“, wohl aber occasionally à la tache[9] bezahlter
spy[10] der preußischen Gesandtschaft. Er hat nie einer
Kommunistengesellschaft angehört, nicht einmal dem öffentlichen
deutschen Arbeiterverein in London. Reuter wohnte in demselben
Hause wie Dietz, der Sekretär und Archivar der Willich-
Schapperschen Zentralbehörde. Reuter erbrach das Schreibpult von
Dietz und gab irgendeinem, Stieber oder Schultze, die Papiere. Die
Sache war längst herausgekommen vor den Kölner
Assisenverhandlungen. Stechan erhielt nämlich während seiner Haft
in Hannover mehrere von ihm an Dietz, als an den Sekretär des von
Schapper präsidierten Flüchtlingskomitees gerichtete Briefe von dem
Untersuchungsrichter vorgelegt. Stechan brannte bekanntlich durch
aus dem Gefängnis. In London angekommen, schrieb er nach
Hannover, um jene Briefe herauszuverlangen, damit er den Reuter
vor den englischen Gerichten verfolgen könne:
1. Wegen Diebstahl mit Effraktion. [Widerrechtliches Aufbrechen.]
2. Wegen Falsums.[11] Er behauptet nämlich, in seinem – den
Kölner Juries jetzt auch von Stieber vorgelegten – Briefe sei das „530
Taler, 500 für die Führer“ interpoliert, von der Polizei
hineingeschrieben. Er habe nur 30 Taler damals nach London
geschickt und kein Wort von Führern gesprochen.
Das Hannoversche Gericht ging natürlich nicht auf Stechans
Verlangen ein. Derselbe Reuter hat die sämtlichen Dokumente durch
Effraktion des Dietzschen Pultes gestohlen. Dietz und die
Schappersche Clique entdeckten die Sache erst, als Stechan hier
ankam.“
Soeben, lieber Engels, erhalte ich Euer Paket. Es ist also nicht
nötig, daß Du Vorliegendes abschreibst. Ich werde es selbst direkt
schicken unter einem der mir zugekommenen Kuverts.
Sage Weerth, daß er sich jetzt eine der „Minister“stellen, die
Stieber zu meiner Disposition gestellt, für immer gesichert hat, wenn
er den ihm zugedachten Gesandtschaftsposten in Paris nicht
vorzieht.
Dein K. M.

Wenn Du mir wichtige Sachen zu schreiben hast, so tu es jetzt


unter der Adresse: A. Johnson, Esq., Bullion Office, B. o. E. (Bank of
England).

[1] Daß sie mit jemand, der stärker ist, zu tun haben.

[2] Wirtsleute.

[3] Doppelte Bestallung.

[4] Vor Mr. Wingham, Polizeirichter des Bezirkes für die Hauptstadt.

[5] Mit Leidenschaft.

[6] Verein des Dr. Marx.

[7] Kellner, Aufwärter.

[8] Auf frischer Tat.

[9] Gelegentlich nach dem Stück.

[10] Spion.

[11] Fälschung.

204
Lieber Marx! Manchester, 28. Oktober 1852. (I.)
Gestern schickte ich Dir einen Band Dureau de la Malle und einen
Brief per Carver & Co. Hiermit erhältst Du verschiedene
kaufmännisch zugerichtete Kuverts mit inliegenden Enveloppen für
Hontheim und Esser I, die weniger bei Bürgern Verdacht erregend
sind als Schneider. Hältst Du es für passend, so kannst Du inliegend
immer noch ein versiegeltes Kuvert für Schneider machen. Ich sehe
indes nicht ein, warum Du nicht auch von Zeit zu Zeit die anderen
Verteidiger durch ein paar Zeilen von ihrer Wichtigkeit überzeugen
solltest. Auch wird ein kaufmännisches Petschaft beigelegt. Dein
altes Weydemeyersches Wappen und das plumpe S sind nichts wert.
Wende auch nach Manchester irgend ein anderes six penny-
Petschaft an.
Schicke von Zeit zu Zeit weniger wichtige registrierte Briefe an
Schneider, um die Kerls irre zu leiten und glauben zu machen, daß
man den geheimen Weg drangegeben habe aus Mangel an
Adressen.
Daß die Bürger, deren Adressen Du hier erhältst, die Briefe richtig
besorgen, daran kann wohl kein Zweifel sein.
Mache doch die Advokaten auf die offenbaren crimes und délits[1]
aufmerksam, die die Polizei begeht, und sieh, daß sie auf Verhaftung
des Stieber wegen falschen Eides und Zeugnisses antragen, der Kerl
hat ja mit Deinem Kothesbrief effektiv Perjury[2] begangen.
Per Post heute abend mehr über gleichgültigere Sachen.
Dein F. E.

[1] Verbrechen und Vergehen.

[2] Meineid.

205
Lieber Marx! Manchester, 28. Oktober 1852. (II.)
Hierbei ein Artikel für Dana – die Sache war nicht anders
abzubrechen. Gelingt es mir, noch heute abend das Ganze
fertigzubringen, so bringe ich’s später noch auf die Post. Einstweilen
geht dies, damit Du doch wenigstens etwas zur Zeit erhältst.
Übrigens kann Dana zur Abwechslung auch einmal mit 3/4 bis 4/5
Druckspalten zufrieden sein, besonders wenn er so langsam zahlt.
Ich würde mich gar nicht wundern, wenn der Kölner Prozeß noch
einen Monat dauert. Am Montag scheint keine Sitzung gehalten
worden zu sein – vielleicht war ein Angeklagter oder ein paar
Geschworene krank, oder alle bedurften zwei Rasttage
hintereinander. Namentlich bei den famosen Zeugen, die alle nichts
auszusagen wissen. Dem Herrn Henze ist schon auf die Kappe
gestiegen worden. Weerth traf diesen Edlen in Hamburg, wo er
fürchterlich auf Dich schimpfte – cela t’acquitte de toute obligation
envers lui.[1] Er gestand auch ganz offen das bürgerliche Motiv
seiner Wut. Schreibe doch direkt – registered letter[2] – an einen
der Advokaten und mache sie darauf aufmerksam, daß die Anklage
ganz aus den Händen des Herrn Sädt in die des Mouchard Stieber
übergegangen, der unter stillschweigendem Konsens des
öffentlichen Ministeriums ganz neue juristische Theorien aufstellt:
1. daß es ein Verbrechen ist, wenn ein moralisch beim Prozeß
Beteiligter vom Ausland den Advokaten Akten und sonstige
Mitteilungen im Interesse der Angeklagten macht und die
Polizeilügen eines Stieber als Lügen aufdeckt; daß es ebenfalls ein
Verbrechen ist, dergleichen Briefe zu empfangen;
2. daß die Polizei dagegen das Recht hat, sich alle möglichen
Verbrechen zu erlauben und sogar damit vor dem Gericht und dem
Publikum öffentlich zu renommieren:
a. Diebstahl mit Einbruch – die Erbrechung des Pultes von Dietz
und die Entwendung der Aktenstücke daraus;
b. Verleitung dazu, eingestandenermaßen durch Geldangebote;
ebenso Bestechung;
c. Diebstahl von Akten, die der Verteidigung gehören, indem man
von Deinem Memoire für die Advokaten ein Stück abschneidet und
zurückbehält; von der Brieferbrechung will ich nicht einmal sprechen,
weil die Kerle da nachher wenigstens legale Formen vorzuschieben
suchen;
d. falsches Zeugnis und Meineid, indem Herr Stieber absichtlich die
Kölner als Beteiligte und Genossen von Cherval usw. hinstellt, was er
selbst besser weiß und nachher auch zugibt; indem er namentlich
schwört, daß ein Brief erst am 19. Oktober mit der Post in Köln
angekommen sei, der schon am 15. da war, indem er seine ganze
Lüge vom außerordentlichen Kurier erfindet usw.;
e. Fälschung, indem das angebliche Protokoll direkt von der Polizei
geschmiedet und als echt vorgelegt wird, während uns alle Mittel
abgeschnitten werden, den Gegenbeweis in die Hände der
Verteidiger zu liefern.
Und so weiter.
Wenn die Advokaten sich brav und geschickt benehmen, so kann
die Sache nicht mit der Verurteilung der Kölner, sondern mit der
Arretierung des Herrn Stieber wegen Meineids und sonstiger
preußischer Verbrechen gegen den gottlosen französischen Code
pénal endigen.
Ich wollte Dir noch über was anderes schreiben, aber ich hab’s
total vergessen, da ich mit Weerth, der eben nach Hause kommt,
geplaudert habe.
Eben höre ich von ihm, daß Frau Daniels auch als Schutzzeugin
zitiert ist – tant mieux.[3] Die Protokolle werden ein schönes Ende
nehmen. Und ce pauvre[4] Bermbach scheint gleich ohne weiteres
mit aufs Angeklagtenbänkchen gewandert zu sein. Was sie nur
diesem unschuldigen armen Teufel wollen mögen!
Dein F. E.

[1] Das enthebt Dich jeder Verpflichtung ihm gegenüber.

[2] Eingeschriebener Brief.

[3] Um so besser.

[4] Dieser arme.

206
Lieber Frederic! 28 Deanstreet, 2. November 1852.
Deinen Brief nebst 5 Pfund erhalten. 10 Schilling an Dronke
gegeben.
Die Zeit ist jetzt vorbei, wo wir uns zu genieren haben, offen zu
schreiben unter unseren direkten Adressen. Sonnabend (30.
Oktober) erhielten die Advokaten die Masse der Dokumente,
Sonntag den zweiten Brief von Frankfurt, gestern meinen letzten
Brief mit der Deklaration vor dem Magistrat. Heute habe ich die im
heutigen Morning Advertiser erschienene Deklaration an Schneider II
direkt registriert geschickt, weniger, weil dies jetzt noch nötig ist, als
damit die preußische Regierung sieht, daß wir Mittel haben, die
Ehrlichkeit ihrer Post zu forcieren und im Gegenfall sie vor dem
Londoner Publikum bloßzustellen.
Die Advokaten haben alles Nötige rechtzeitig erhalten, nämlich vor
Schluß der Anklage. Gegenwärtig bin ich der Meinung, daß, sollte
nicht ein neuer Inzident den Prozeß verlängern und eine neue
Intervention unsererseits nötig machen, nichts mehr nach Köln
abgeht. –
Was den mir fälschlich zugeschriebenen Wisch betrifft, so fehlt mir
nur noch die Adresse von Moses Heß, der in Lüttich haust. Ich werde
ihm nämlich schreiben: „Erkläre mir, wem Du die Katechismen
gegeben und wer sie kolportiert hat in Deutschland, sonst erkläre ich
Dich in der Independence für einen Forger.[1]“ Moses wird schon
herausrücken.
Vergiß nicht, mir den Schluß für Dana zu schicken. Donnerstag
kommt das Parlament zusammen. Der Artikel ist schon jetzt etwas
antiquiert. Nach Freitag aber hätte er gar keinen Wert mehr.
Beste Grüße an Weerth und Strohn.
Dein K. M.

[1] Fälscher.

207
Lieber Engels! London, den 4. November 1852.
Ich muß die paar Zeilen an Dich heute diktieren, da die perfiden
Preußischen mich am Sitzen hindern.
Einliegend Brief von Schneider, der gestern abend ankam.
Du siehst, daß Simeon sein Manuskript zurück haben will.
Vehse erzählte mir gestern, Weerth habe ihn zu einem falschen
Termin nach London bestellt, worüber ich ihm die gehörigen
Aufklärungen gab.
Dein K. M.

Viele Grüße vom Sekretär, der Ehefrau Marx’.


Kossuth ist wütend über Marx, daß er seinen dodge[1] mit
Bonaparte, Vetter usw. dem Dana mitgeteilt, der aus diesen Notizen
einen fulminanten Artikel gemacht hat.
[1] Winkelzug, Mogelei.

208
Lieber Marx! [Undatiert. Freitag, 5. November 1852.]
... Die Aktenstücke sind also glücklich angekommen, auch der Brief
Stiebers im Original. Jetzt wird die Sache heiter, sobald der edle
öffentliche Ankläger geendigt haben wird. Etwas Alberneres, als was
der Seckendorf sagt, ist doch selbst bei angestrengter saurer Arbeit
des Gedankens nicht ans Licht zu fördern. Weil der Engels hat
drucken lassen, daß die besten Kommunisten die couragiertesten
Soldaten waren, deswegen muß Bürgers wegen Komplott verdonnert
werden. Die Fragestellung schließe in sich, ob der Angeklagte den
Willen gehabt habe – suspect de suspicion d’incivisme[1] –, und
daher sei es auch ganz gleichgültig, ob der Angeklagte Mitglied des
Bundes sei oder nicht – also Herr Seckendorf in seiner Verzweiflung
an der Verurteilung von Daniels und Komp. fordert die
Geschworenen direkt auf, auch den Bürgers und Röser
freizusprechen! Der Kerl muß wenigstens acht Nächte durch stark
brandy and water[2] gesoffen haben, ehe es ihm so wüst und wirr
im Kopfe werden konnte. In der ganzen Schmiere ist doch auch nicht
ein Wort to the purpose.[3] Übrigens habe ich an der Freisprechung
auch von Bürgers usw. keinen Moment mehr gezweifelt, seit der
Präsident die Fragestellung bekannt gemacht. Es ist unmöglich,
Bürgers’ Jammermanifest und seine Rundreisen in ein
„Unternehmen“ zu verwandeln, das den Zweck hatte, die
Staatsverfassung usw. Oder soll es in den Annalen der Geschichte
heißen: Im Mai des Jahres 1851, während in London der Glaspalast
eröffnet wurde, reiste der Schneider Nothjung von Berlin nach
Leipzig, um die preußische Staatsverfassung umzustoßen und den
Bürgerkrieg zu beginnen. Zudem ist das Protokollbuch fallen
gelassen, und, wie Strohn behauptet, sind unter den Geschworenen
v. Rath, v. Bianco, Leven, Leiden, Herstatt und noch einer ganz gut.
Ich glaube, wie sich die Sache jetzt entwickelt, auch, daß wir
unter allen Umständen etwas publizieren müssen. Es wäre nur gut
und sogar nötig, daß nach dem Prozeß Schneider und einer der
Angeklagten nach London kämen – ich würde sehen, daß ich dann
auf einen Samstag und Sonntag nach London käme, und wenn alles
abgesprochen, könntest Du mit hierher gehen, und das Manuskript
würde in einigen Tagen fertig sein. Inzwischen schreibe an den alten
Ebner, ob er dies Broschürli nicht bei Löwenthal anbringen kann –
meinetwegen auf halbe Rechte, für Gewinn wie Verlust, zwischen
ihm und uns.
Den 6. November. Ich kam gestern aus physischen Gründen nicht
zur Absendung des Obigen. Seitdem wieder eine Stieberiade in der
Kölnischen Zeitung gelesen. Also das Originalprotokollbuch ist fallen
gelassen, dagegen Herr Liebknecht in Gestalt einer Geldquittung von
den Toten erstanden. Monsieur Hirsch und Komp. – denn es müssen
ihrer mehrere sein – scheinen die dummen preußischen Polizisten
gehörig um Geld beschwindelt zu haben. Il valait bien la peine,[4]
einen Polizeileutnant nach London zu schicken, um diesen Bären
angebunden zu erhalten, und dazu die Nachricht von der ganz
geheimen Sitzung bei Dir.
Was ist das aber eine Geschichte mit dem Fleury, Dronkes Freund,
der hier direkt und offen als Polizeiagent bezeichnet wird? – –
„Bürgers ist geständig, Mitarbeiter der Neuen Rheinischen Zeitung
gewesen zu sein!“ Das ist natürlich hinreichend, ihn zum Galgen
verurteilen zu lassen. So was ist mir doch noch nicht vorgekommen.
Heute abend wird die Kölnische Zeitung nun wohl die ersten
Nachrichten darüber bringen, daß sich das Blättchen gewendet hat.
Die Advokaten haben sehr richtig agiert, daß sie alles zurückhielten,
wenn sie nur jetzt gehörig ins Geschirr gehen.
Dein F. E.

[1] Des Verdachtes schlechter Gesinnung verdächtig.

[2] Kognak mit Wasser, Grog.

[3] Zur Sache.

[4] Es lohnte sehr der Mühe.

209
Lieber Engels! 28 Deanstreet, 10. November 1852.
Einliegend Bericht meiner Frau über das gestrige Robert-Blum-
Meeting. Sie war in der Galerie der Free Mason Tavern, wo es
stattfand, mit Imandt.
Nun zu der Kölner Angelegenheit.
Ich in Bürgers’ usw. Stelle würde Herrn Becker keinesfalls erlaubt
haben, auf Kosten aller anderen sich so unverschämt als den homme
supérieur[1] hinzupflanzen und zum Triumph der Demokraten den
Charakter des ganzen Prozesses so sehr herabzudrücken. Sich
verteidigen und sich eine Apologie auf fremde Kosten halten, sind
zweierlei. Becker ist einer der Epigonen der Revolution, der viel
Schlauheit, aber wenig Verstand [besitzt].
Die Regierung in ihrer Verzweiflung hatte, wie Du schon weißt, in
dem nachträglichen Bericht des Goldheim, zu heroischen Mitteln ihre
Zuflucht genommen, aber sich nur von neuem in die Falle geritten.
Die Aussage des Goldheim gab zwei Daten an die Hand: „Greiff“
und „Fleury“.
Ich stellte also Nachforschungen an (mietete zu diesem Zwecke
selbst einen preußischen Mouchard) über Greiff. Ich erhielt so seine
Adresse und fand, daß er 17 Victoria Road, Kensington, wohne. Dies
ist aber das Haus des Herrn Fleury. Es war also konstatiert, daß
Greiff bei Fleury wohnt. Ferner stellte sich heraus, daß Greiff hier
offiziell nicht als „Polizeileutnant“, sondern als Attaché der
preußischen Gesandtschaft figuriert. Endlich, daß er Sonnabend den
6. November von hier abgereist ist für einige Wochen,
wahrscheinlich nach Köln. Er selbst erklärte, er reise aus Furcht vor
den Marxianern ab. Fleury habe ihn geprellt usw.
Es war nun also klar, Greiff, der Vorgesetzte von Fleury, Fleury der
Vorgesetzte von Hirsch. So hat sich die Sache auch herausgestellt.
Andererseits begaben sich Freitag den 5. November Imandt und
Dronke zu Fleury, mit der Kölnischen Zeitung in der Hand. Er spielte
natürlich den Überraschten, behauptete, keinen Greiff zu kennen,
erklärte sich zu allen Erklärungen vor dem Magistrat bereit, wollte
aber vorher seinen Advokat sprechen. Gab zwei Rendezvous, für
Sonnabend den 6. November eines für 2, das andere für 4 Uhr,
hütete sich aber wohl zu erscheinen und machte, daß die Polizei so
einen neuen Tag gewann, an dem wir nicht operieren konnten,
einige vorläufige Briefe nach Köln abgerechnet. Sonntag den 7.
November endlich preßten ihm Dronke und Imandt eine Erklärung
ab, die Du in der „Kölnischen“ lesen wirst. Ich schicke Dir Kopie
davon, die ich in diesem Augenblick nicht finde. Nachdem sie die
Erklärung in der Tasche, erklärten sie ihm, er sei Spion, Greiff wohne
bei ihm, wir hätten alles das gewußt und mit der Polizei gespielt,
während sie mit uns zu spielen glaubte. Er fuhr natürlich fort, seine
Unschuld zu beteuern.
Endlich sandte ich Leute herum, um Hirschs Wohnung
aufzutreiben. Es fand sich, daß er nicht weit von Fleury, ebenfalls in
Kensington wohne.
Ehe ich nun weiter erzähle, noch eines. Die ganze Aussage des
Goldheim wird Dir sehr klar, wenn Du erwägst: 1. daß am 30.
Oktober (Sonnabend) Goldheim hier war und mit dem preußischen
Gesandtschaftssekretär Albert sich zu Greiff und Fleury begab; 2.
daß am Morgen desselben 30. Oktober unsere Erklärung über die
bevorstehenden Enthüllungen in fünf englischen Blättern erschien; 3.
daß für denselben 30. Oktober Fleury dem Imandt und Dronke ein
Rendezvous gegeben, weil Dronke statt dem Imandt die französische
Stunde für ihn übernehmen solle; 4. daß bevor Stieber seine zweite
Vernehmung mit den Enthüllungen über London gab, ich gleich nach
seiner ersten Vernehmung über Cherval usw. eine Erklärung in die
„Kölnische Zeitung“, „Frankfurter Journal“ und „Nationalzeitung“
schickte, worin schon dem Stieber mit seinem Briefe an mich
gedroht wurde. Diese Erklärung erschien zwar in keiner der
Zeitungen, Post und Polizei hatten aber unstreitbar Notiz davon
genommen.
So klärt sich die „Hellseherei“ Stiebers und die Allwissenheit seiner
Polizeiagenten in London höchst prosaisch auf. Alles, was Goldheim
sonst gesagt, waren Fabulae.[2] Nach Köln habe ich auf
verschiedenen Wegen die nötige Erklärung über diese Dinge
gelangen lassen neben Fleurys Erklärung.
Aber nun kommt ein Hauptwitz.
Es war natürlich meine Absicht, einen Warrant [Haftbefehl] gegen
den Hirsch zu nehmen, wozu ich seine Wohnung ausgeforscht hatte.
Ich erhielt die Adresse aber erst Sonnabend. Hatte ich den Warrant
gegen Hirsch, so war ich sicher, daß dieser den Fleury und Fleury
den Greiff hereinreiten würde.
Was geschieht? Willich, ganz im geheimen, begibt sich am Freitag
mit Hirsch in Gegenwart Schärttners auf die Magistratur in
Bowstreet, läßt Hirsch angeblich in einem dreifach gefertigten
Dokument gestehen, daß er und Fleury seit einem halben Jahre
ungefähr die falschen Protokolle fabriziert, schickt diese drei
Dokumente 1. an Göbel, den Assisenpräsidenten, 2. an Schneider, 3.
an die Kölnische Zeitung – und gibt dem Hirsch Geld zum Entrinnen,
ja, läßt ihn selbst auf den Dampfer bringen, angeblich damit er
selbst in Köln gesteht.
Wir alle erfuhren dies erst durch die Nachforschungen, die wir
nach Hirsch angestellt, und zum Teil in Bowstreet, wo wir [den]
Warrant herausnehmen wollten. Schapper erzählt dem Liebknecht,
daß Willich ihm kein Wort von dem allen mitgeteilt. So hat Herr
Willich uns die Handhabe der Prozedur, die wir in London selbst
anstellen wollten, aus der Hand eskamotiert! – – –
Wie hoch dieser Fleury übrigens (ich habe ihn nie gesehen) bei
den Demokraten angesehen – Techow, bei seiner Abreise nach
Australien, schrieb ihm noch vom Schiff einen Brief, worin er ihm
bezeugt, daß Kopf und Herz ihm auf dem rechten Fleck sitzt. –
Hirsch hat gestanden, er habe Liebknechts Handschrift
nachzumachen versucht und unter der Leitung des Kaufmanns
Fleury (dieser Hund ist dabei vermögend und in eine sehr
respektable englische Quäkerfamilie hineingeheiratet) gearbeitet,
wie Fleury selbst unter Greiffs Leitung stand. So bestätigt sich
vollkommen alles, was ich gleich aus dem von der Kölnischen
Zeitung gegebenen Inhalt und Daten des Originalprotokollbuches
herausdeduziert hatte und was von den Advokaten bis jetzt keiner
gehörig exploitiert hat.
Daß die Kölner Angeklagten freikommen, alle ohne Ausnahme,
unterliegt nach meiner Ansicht keinem Zweifel.
Es ist mir lieb, wenn Du dem Strohn schreibst, er verpflichte mich
sehr, wenn er gleich einige Pfund mitschicke. Von den 4 Pfund 10
Schilling, die ich durch Dich erhalten, sind beinahe 3 Pfund für die
Laufereien, Mouchards usw. draufgegangen. Es benutzen natürlich
auch unsere armen Bundesfreunde die vielen Laufereien,
Rendezvous usw., um eine ganz erträgliche Summe von faux frais de
production[3] für Bier, Zigarren, Omnibus usw. herauszubeißen, die
ich natürlich liquidieren mußte.
Die Gedichte von Freiligrath erhältst Du. –
Dein K. M.

Vehse gestern abgereist. Nach Frankfurt schon wegen unserer


Broschüre geschrieben. Schreiben wir nicht, so bemächtigt sich
Becker ad majoram gloriam Beckerii[4] der ganzen Geschichte.

[1] Überlegenen Mann.

[2] Fabeln.

[3] Produktionsunkosten.

[4] Zum höheren Ruhme Beckers.

210
Lieber Engels! 28 Deanstreet, Soho, London, 16.
November 1852.
Wenn es Dir möglich ist, so mache für Freitag einen Tribuneartikel
über die Kölner Affäre. Du kennst jetzt alles Material ebensogut wie
ich, und ich habe seit vier bis fünf Wochen meine Hauslumpereien so
sehr vernachlässigt über dem public business,[1] daß ich diese
Woche noch, auch beim besten Willen, nicht zum Arbeiten komme. –
Eine Erklärung für die englische Presse über die Kölner
Angelegenheit wird heute abend konsultiert. Es wird kaum Zeit
bleiben, sie Dir noch vorher zur Ansicht zuzuschicken. Machst Du
aber eine solche, die bis Donnerstag morgen noch hier ist, so ist es
mir lieber.
Gruß an Weerth.
Dein K. M.

Kossuth-Mazzini ließen sich am 5. bei dem Rugemeeting krank


melden. Dafür erschienen sie am 10. bei den „Friends of Italy“.[2]
Ledru-Rollin entschuldigte sich gar nicht.

[1] Öffentliche Angelegenheit.

[2] Freunde Italiens [Verein von Freunden der Befreiung Italiens].

211
Lieber Engels! 28 Deanstreet, Soho, London, 19.
November 1852.
Der Bund hat sich vergangenen Mittwoch auf meinen Antrag hin
aufgelöst und die Fortdauer des Bundes auch auf dem Kontinent für
nicht mehr zeitgemäß erklärt. Auf dem Kontinent hatte er übrigens
ja seit der Verhaftung von Bürgers, Roeser faktisch schon aufgehört.
Einliegend eine Erklärung für die englischen Blätter usw. Außerdem
mache ich noch eine lithographierte Korrespondenz ausführlich über
die Polizeischweinereien und für Amerika eine Aufforderung zu Geld
für die Gefangenen und ihre Familien. Freiligrath Kassierer.
Gezeichnet von allen unseren Leuten.
Dein K. M.

212
Lieber Marx! Samstag, 27. November 1852.
Wenn ich Dir viel schaffen kann für den Druck der Broschüre, so wird
es zwei bis drei Pfund höchstens sein – ich bin augenblicklich selbst
fest. Aber drei Druckbogen, das gibt zwischen 10 bis 12 Pfund
Kosten, mit Broschieren usw. noch mehr. Wenn die Sache nicht auf
dem Kontinent und für Rechnung, wenigstens unter Beteiligung,
eines Buchhändlers gedruckt wird, so kommt sie gar nicht herum. In
Preußen usw. wird sie, wenn sie hinkommt, konfisziert, und die
Buchhändler prellen uns. Wir werden also das Geld als der
Geschichte geopfert ansehen müssen, denn heraus kommt in Pfund,
Schilling, Pence gewiß nichts dabei. Es fragt sich nun, ob wir diesen
Betrag jetzt daran setzen können; ob es nicht besser wäre, die
Geschichte auf einen bis anderthalb Bogen zusammenzudrängen,
damit die Kosten unseren Kräften etwas angemessener werden?
Dezember und Januar sind meine zwei schwersten Monate im Jahre;
vor Februar kann ich schwerlich an weitere Zahlungen für die Kosten
denken. Lassen wir auf Kredit drucken, so hält uns der Drucker am
Ende, wie dem Weydemeyer, die Exemplare zurück, bis er bezahlt
ist. Und unter allen Umständen müssen wir doch vorher sehen,
welche Möglichkeit der Verbreitung da ist; bis jetzt sehe ich aber so
gut wie gar keine.
Weerth wird morgen nach London kommen, er segelt am 2.
Dezember von Southampton ab. Seine Ausstaffierung ist ihm sehr
teuer zu stehen gekommen. Strohn reist auch dieser Tage nach
London und von da nach dem Kontinent. Bei den vielen Reisespesen,
die sein Etablissement (noch dazu, wie ich höre, mit fremdem
Kapital) ihm macht, wird auch von ihm nichts zu erpressen sein. So
sind wir alle fest.
Meine Meinung ist, wenn Du nicht ganz gute buchhändlerische
Wege zur Verbreitung hast, so wird die Geschichte gar nicht einmal
bekannt und geht vorüber, wie alle in der Emigration gedruckte
Literatur, ohne daß man in Deutschland die Geschichte zu sehen
bekommt. Und das ist sehr schlimm, in mancher Beziehung sogar
schlimmer, als wenn gar nichts geschähe. Denn es bewiese
öffentlich, daß wir auf die ausländischen deutschen Winkelpressen
angewiesen sind und gar nichts ausrichten können. Von der mit dem
Bürgersschen Rundschreiben verknüpften Blamage haben wir uns in
unsere mysteriöse literarische Position zurückziehen können, aber
auch diese kann durch ein solches Geständnis unserer literarischen
Ohnmacht kompromittiert werden. Die preußische Regierung würde
sich freuen zu sehen, daß wir auf die Mittel der Publizität reduziert
sind, die den Demagogen von 1831 im Exil zu Gebote standen und
fast gleich Null waren. Es ist schlimm, daß es so ist, aber ich glaube,
wir tun besser, wenn wir dies wenigstens nicht an die große Glocke
hängen. Und nach der Rheinprovinz, wohin doch der Hauptabsatz
wäre, bringen wir kein Exemplar, ohne hundert Leute zu
kompromittieren, seitdem das neue Verbrechen der
hochverräterischen Korrespondenz [unlesbar] von der Jury
anerkannt ist.
Ich werde Dir das Geld am 1. oder 2. Dezember schicken,
überlege Dir die Sache noch einmal, und wenn Du glaubst, doch die
Broschüre besser auf diesem Wege als gar nicht zu drucken, so
suche wenigstens solche Arrangements zu treffen, daß wir mit dem
Zahlen nicht in Verlegenheit kommen, denn, wie gesagt, vor Februar
kann ich mich zu nichts verpflichten. – –
Grüße Deine Frau und Kinder bestens. In etwas über zwei Wochen
bin ich in London.
Dein F. E.

213
Lieber Marx! Manchester, Montag, 29. November
1852.
Es ist mir über beiliegendem Artikel 1 Uhr nachts geworden, aber
morgen früh 9 geht noch eine Post. Ich will das Experiment
versuchen, ob Du ihn noch zur Zeit für den Steamer erhältst
(Dienstag abend per ersten Mail nach Liverpool), wo nicht, mußt Du
ihn per Freitagsteamer senden.
Morgen muß ich aus der Stadt, komme ich früh genug wieder, so
schicke ich Dir Geld.
Erhalte ich bald einen Artikel über England für die Tribune? Ich
kann jetzt wieder arbeiten.
Cobden scheint in seinen Ministerhoffnungen von Graham und
Russell etwas enttäuscht worden zu sein, diese scheinen ihn kühl
abfahren zu lassen, sonst kann ich mir seine Wut am Freitag nicht
erklären. Seit 1844 hat der Kerl nicht so ingrimmig gesprochen. He is
a disappointed demagogue again,[1] solange wie es dauert.
Übrigens ist es gut, daß die Tories in der Majorität waren, nun
kriegen wir doch Disraelis Budget zu hören. Hätte der Kerl mehr
Kenntnisse und Verstand und weniger Schlauheit und Diebsgelüste,
so wäre nichts leichter, als den freetradern ein freetradebudget[2]
zurecht zu machen, wobei ihnen grün und rot vor den Augen wird.
Wenn sich die Kerle nur halten, bis die Krise kommt! Wir sind
décidément im excitement,[3] obgleich auch dies noch sehr piano,
piano geht. Aber einerlei, die sechs Seiten joint-stock[4]-Annoncen
der heutigen Daily News, woraufhin sie schon die Times
auszustechen glaubt, und dazu die zirka fünfzig bis achtzig
ausländischen Eisenbahnen-, Goldminen-, Dampfschiffs- usw.
Gesellschaften werden ihre unvermeidliche Wirkung nicht verfehlen.
Der Geschmack „nach mehr“ bleibt nicht aus. Glücklicherweise ist
der einzige Umstand, der die Baumwollindustrieüberproduktion
frühzeitig unterbrechen konnte, beseitigt; die neue Ernte wird weit
über drei Millionen Ballen, die größte also, die je da war, und
Baumwolle geht wieder herunter; an Rohstoff wird’s also nicht
fehlen. Jetzt nächstes Jahr eine Mißernte in Korn, und wir werden
einen schönen Tanz erleben. Ohne eine solche ist bei den anormalen
Verhältnissen, den wie Pilze wachsenden australischen und
kalifornischen Märkten, wo ein Individuum zirka viermal soviel
konsumiert als anderswo, weil fast keine Weiber und Kinder da sind
und viel Gold in den Städten verludert wird, bei dem neuen Markt,
den Kalkuttaer Häuser jetzt schon in Birma exploitieren, bei der
Ausdehnung des Handels von Bombay und Karatschi mit dem
Nordosten von Indien und den Grenzländern (diese speziell ist sehr
groß) usw., schwerlich zu sagen, ob es im nächsten Jahre schon zu
etwas Dezisivem [Entscheidendem] kommt.
Dein F. E.

[1] Er ist wieder ein enttäuschter Demagoge.

[2] Freihandelsbudget.

[3] Entschieden in der Erregung.

[4] Aktiengesellschafts-.

214
Lieber Frederic! 28 Deanstreet, Soho, London, 3.
Dezember 1852.
Du würdest schon lange Antwort auf den Brief (mit der Einlage des
Aufsatzes für Dana) erhalten haben, wenn ich nicht doppelt
beschäftigt und abgehalten gewesen wäre durch das Diktieren
meiner Broschüre in Reinschrift und dann durch Besuche von
Weerth, Strohn, Damm usw.
Die Broschüre wird aller Wahrscheinlichkeit nach in der Schweiz
gedruckt bei Schabelitz junior, der sich von seinem Alten separiert
und eine eigene Buchhandlung etabliert hat. Außerdem kann Cluß,
wenn er die Produktionskosten damit herauszuschlagen meint, die
Sache in Washington drucken lassen. Gedruckt muß die Sache
werden, schon um als öffentliches Dokument nach Ausbruch der
Revolution vorhanden zu sein. Ich habe noch neue, sehr
interessante Entdeckungen über das Komplott Cherval usw.
gemacht, die Du hoffentlich gedruckt lesen wirst.
Weerth kam Sonntag abend, fand mich sehr beschäftigt und nicht
ganz rosig gelaunt. Er fragte mich, „was ich denn eigentlich über die
Kölner Geschichte schreiben wolle?“ – und dies zwar in etwas
vornehm näselndem Tone. Ich fragte ihn, „was er in Westindien
wolle?“, und nach Zeit von einer Viertelstunde verschwand er.
Dienstag abend kam er wieder und sagte mir, er hätte eigentlich
nicht wieder kommen wollen, habe aber dem Andringen Freiligraths
nachgegeben. Ich habe ihm nämlich Sonntag sehr beschäftigt und
verdrießlich geschienen. Ich nahm mir die Freiheit, Herrn Weerth
darauf aufmerksam zu machen, daß er neun Zehntel der Zeit, die ich
ihn kenne, immer verdrießlich und malcontent war, was er von mir
nicht behaupten werde. Nachdem ich ihm den Kopf etwas
gewaschen, fand er sich wieder zurecht und wurde – wieder der alte
Weerth. Ich finde, daß er verdammt verbürgert ist und seine Karriere
zu sehr „au sérieux“[1] nimmt. Strohn ist wenigstens immer der alte
und pas trop fin.[2]
Bonapartes Kaiserreichhonigmonate sind prächtig. Der Kerl hat
immer auf Pump gelebt. Machen wir die Pumpanstalten in Frankreich
so allgemein und allen Klassen der Franzosen so zugänglich als
möglich – und alle Welt wird glauben, daß das Millennium
herangekommen ist. Dazu direkt eine eigene Bank für stockjobbery
und railwayhumbug.[3] Der Kerl bleibt sich immer gleich. Der
Industrieritter und der Prätendent verleugnen keinen Augenblick
einer den anderen. Wenn er nicht Krieg macht und bald macht, so
geht er an den Finanzen kaputt. Gut ist’s, daß Proudhons
Erlösungspläne sich in der einzigen Form realisieren, in der sie
praktikabel sind – als Kreditschwindel und mehr oder minder direkte
Prellerei.
Ich freue mich sehr auf Deine Ankunft hierher.
Welcome to our website – the ideal destination for book lovers and
knowledge seekers. With a mission to inspire endlessly, we offer a
vast collection of books, ranging from classic literary works to
specialized publications, self-development books, and children's
literature. Each book is a new journey of discovery, expanding
knowledge and enriching the soul of the reade

Our website is not just a platform for buying books, but a bridge
connecting readers to the timeless values of culture and wisdom. With
an elegant, user-friendly interface and an intelligent search system,
we are committed to providing a quick and convenient shopping
experience. Additionally, our special promotions and home delivery
services ensure that you save time and fully enjoy the joy of reading.

Let us accompany you on the journey of exploring knowledge and


personal growth!

ebookultra.com

You might also like